[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

MXPA06014116A - Identificacion de tumores. - Google Patents

Identificacion de tumores.

Info

Publication number
MXPA06014116A
MXPA06014116A MXPA06014116A MXPA06014116A MXPA06014116A MX PA06014116 A MXPA06014116 A MX PA06014116A MX PA06014116 A MXPA06014116 A MX PA06014116A MX PA06014116 A MXPA06014116 A MX PA06014116A MX PA06014116 A MXPA06014116 A MX PA06014116A
Authority
MX
Mexico
Prior art keywords
genes
sequences
tumor
seq
types
Prior art date
Application number
MXPA06014116A
Other languages
English (en)
Inventor
Mark G Erlander
Xiao-Jun Ma
Original Assignee
Aviaradx Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aviaradx Inc filed Critical Aviaradx Inc
Publication of MXPA06014116A publication Critical patent/MXPA06014116A/es

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/10Signal processing, e.g. from mass spectrometry [MS] or from PCR
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/30Unsupervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/10ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • C12Q1/6837Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Theoretical Computer Science (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Bioethics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Oncology (AREA)
  • Primary Health Care (AREA)
  • Hospice & Palliative Care (AREA)
  • Signal Processing (AREA)
  • Medicinal Chemistry (AREA)

Abstract

La invencion proporciona metodos para el uso de mediciones de expresion de gen para clasificar o identificar tumores en muestras obtenidas de un sujeto en una instalacion clinica, tal como en casos de muestras incrustadas en parafina, fijadas con formalina (FFPE).

Description

IDENTIFICACIÓN DE TUMORES CAMPO DE LA INVENCIÓN Esta invención se relaciona al uso de la expresión de gen para clasificar tumores humanos. La clasificación se realiza mediante el uso de perfiles de expresión de gen, o patrones, de 50 o más secuencias expresadas que están correlacionados con tumores que surgen de ciertos tejidos así también que están correlacionados con ciertos tipos de tumor.
La invención también proporciona el uso de 50 o más secuencias de gen específicas, la expresión de las cuales están correlacionadas con la fuente de tejido y el tipo de tumor en varios cánceres. Los perfiles de expresión de gen, ? i ya sea englobados en la expresión de ácido nucleico, expresión de proteína u otros formatos de expresión, pueden ser utilizados para determinar una muestra que contiene células como que contiene células de tumor de un tipo de tejido o de un origen de tejido para permitir una identificación más precisa del cáncer y de esta manera el tratamiento del mismo así como la prognosis del sujeto de quien se obtuvo la muestra. BREVE DESCRIPCIÓN DE LA INVENCIÓN Esta invención se relaciona al uso de las mediciones de expresión de gen para clasificar o identificar tumores en muestras que contienen células obtenidas de un sujeto en una instalación clínica, tal como en casos de muestras incrustadas en parafina, fijadas con formalina (FFPE) . La invención proporciona la habilidad para clasificar tumores en las condiciones del mundo real enfrentadas por el hospital y otros laboratorios que tienen que conducir ,1a prueba en muestras de FFPE clínicas. La invención también puede ser aplicada a otras muestras, tales como muestras frescas, que se han sometido de nada a poco o mínimo tratamiento (tal como simplemente el almacenamiento en una temperatura no de congelación, reducida) y muestras congeladas. Las muestras pueden ser de una muestra de tumor primario o de un tumor que ha resultado de una metástasis de otro tumor. Alternativamente, la muestra puede ser una muestra citológica, tal como, pero no limitada a, células en una muestra de sangre. En algunos .casos de una muestra de tumor, los tumores no pueden haberse sometido a la clasificación ' mediante las técnicas de patología i. U tradicionales, pero pueden haberse inicialmente clasificado sino se desea confirmación, ' o se han clasificado como un "carcinoma de primario desconocido" (CUP) o "tumor de origen desconocido" (TUO) o "tumor primario desconocido". La necesidad para la confirmación es particularmente relevante en vista de los estimados de 5 a 10% de mal clasificación utilizando técnicas estándares. Así la invención puede ser visualizada por proporcionar medios para identificación de cáncer o CID.
En un primer aspecto de la invención, la clasificación se realiza mediante el uso de perfiles de expresión de gen, o patrones, de 50 o más secuencias expresadas. Los perfiles de expresión de gen, ya sea englobados en la expresión de ácido nucleico, expresión de proteína u otros marcadores de expresión de gen, se pueden utilizar para determinar una muestra que contiene células como que contiene células de tumor de un tipo de tejido o de un origen de tejido para permitir una identificación más precisa del cáncer y de esta manera el tratamiento del mismo así también la prognosis del sujeto de quien se obtuvo la muestra. En algunas modalidades, la invención se utiliza para clasificar entre por lo. menos 34 o por lo menos 39 tipos de tumor con precisión significante en una instalación clínica. La invención está basada en parte en el descubrimiento sorprendente e inesperado de que 50 o más secuencias expresadas en el genoma humano son capaces de clasificación entre por lo menos 34, o por lo menos 39, tipos de tumor, así como subconjuntos de esos tipos de tumor, de una manera significante. Establecido de manera diferente, la invención está ba.sada en parte en el descubrimiento de que no es necesario utilizar el aprendizaje supervisado para identificar secuencias de gen que son expresadas en correlación con diferentes tipos de tumor. Así la invención está basada en parte en el reconocimiento de que cualquiera de 50 o más secuencias expresadas, a una colección aleatoria de secuencias expresadas, tiene la capacidad para clasificar, y esta manera se puede utilizar para clasificar, una célula que es una célula de tumor de un tejido u origen de tejido. En otro aspecto, la invención proporciona la clasificación de una muestra que contiene células como que contiene una célula de tumor de un tipo de tejido u origen al determinar los niveles de expresión de 50 o más secuencias transcriptas y luego al clasificar la muestra que contiene células como que contiene una célula de tumor de una pluralidad (dos o más) tipos de tumor. Para clasificar entre por lo menos 34 a por lo menos 39 tipos de tumor, y I" subconjuntos de los mismos, asi' como cualquiera de 50 secuencias expresadas pueden ser utilizadas para proporcionar la clasificación de una manera significante. La invención también está basada en parte en la observación de que las secuencias expresadas no necesitan ser aquellas de los niveles de expresión de los cuales son evidentemente o altamente correlacionadas (directamente, indirectamente a través de la correlación con otras secuencias expresadas) con cualquiera dé los tipos de tumor. Así la invención proporciona en una modalidad adicional, el uso de los niveles de expresión de genes, los niveles de expresión de los cuales no son fuertemente correlacionados con la clasificación actual de la muestra de tumor particular, como una de las 50 o más secuencias trascriptas. Todos los genes seleccionados pueden ser tales que no son correlacionados, o solamente una porción de los genes pueden ser correlacionados, típicamente por lo menos 90%, 85%, 75%, 50% o 25%, así como porciones que caen dentro de los intervalos creados al utilizar cualquiera de los dos ejemplos de puntos anteriores como puntos finales de un intervalo. La invención se práctica al determinar los niveles de expresión de las secuencias de gen donde las secue cias no necesitan haber sido seleccionadas en base a una correlación de sus niveles de expresión con los tipos de tumor que son clasificados. Así como un ejemplo no limitativo, las secuencias de gen no necesitan ser seleccionadas en base a sus valores de correlación con los tipos de tumor o una clasificación basada en los valores de correlación. Adicionalmente, la invención puede ser practicada * con el uso de los niveles de expresión de gen que no son necesariamente correlacionados a uno o más niveles de expresión de gen utilizados para la clasificación. Así en modalidades adicionales, la habilidad para el nivel de expresión de una secuencia expresada para funcionar en la clasificación no es redundante con (es independiente de) la habilidad de por lo menos otro nivel de expresión de gen ' utilizado para la clasificación.
La invención puede ser aplicada para identificar el origen de un cáncer en un paciente en una amplia variedad de casos incluyendo, pero no limitados a, la identificación de origen de un cáncer en una instalación clínica. En algunas modalidades, la identificación se hace mediante la clasificación de una muestra que contiene células conocida por contener células de cáncer, pero el origen de esas células es desconocido. En otras modalidades, la identificación se hace mediante la clasificación de una muestra que contiene células que contiene una o más células de cáncer seguido por la identificación del (los) origen (es) de esa(s) célula (s) de cáncer. En modalidades adicionales, la invención se practica con una muestra de un sujeto con una historia previa de cáncer, la identificación se hace "mediante la clasificación de una célula como que ella sea de cáncer de un origen previo de cáncer o un nuevo origen. Modalidades adicionales incluyen aquellos donde múltiples cánceres se encuentran en el mismo órgano o tejido y la invención se utiliza para determinar el origen de cada cáncer, así como si los cánceres son del mismo origen. La invención también está basada en parte en el descubrimiento de que los niveles expresión de secuencias de gen particulares pueden ser utilizadas para clasificar entre tipos de tumor con más grande precisión que los niveles de expresión de un grupo aleatorio de secuencias de gen. En una modalidad, la invención proporciona el uso de los niveles de expresión de 50 a 74 secuencias expresadas de un primer conjunto en el genoma humano para clasificar entre por lo menos 34 por lo menos 39 tipos de tumor con precisión significante. La invención así proporciona la identificación y uso de patrones de expresión de gen (o perfiles o "señales") basado en la 50 a 74 secuencias expresadas correlacionadas con por lo menos los 34 o 39 tipos de tumor. La invención también proporciona el uso de 50 a 74 de estas secuencias expresadas para clasificar entre subconjuntos de los 34 o 39 tipos de tumor. Dependiendo del número de tipos de tumor, se pueden lograr precisiones que varían de arriba de 80% a 100%. En otra modalidad, la invención proporciona el uso de niveles de expresión de 50 a 90 secuencias expresadas de un segundo conjunto en el genoma humano para clasificar entre por lo menos 34 por lo menos 39 tipos de tumor con precisión significante. 38 de las secuencias en el segundó conjunto están presentes en el primer conjunto de 74 secuencias. Los niveles de expresión de las 50 a- 90 secuencias en el segundo conjunto pueden ser utilizadas de la misma manera como es descrito para el primer conjunto de 74 secuencias. Dependiendo del número de tipos de tumor, se pueden lograr precisiones que varían de aproximadamente 75% a aproximadamente 95%.
La invención también está basada en parte en el descubrimiento de que el uso de 50 o más secuencias expresadas para clasificar entre 53 tipos de tumor, que incluyen (pero no limitados a) los 34 y 39 tipos descritos en la presente, fue limitado por el número de muestras disponibles de algunos tipos de tumor. Como es mencionado enseguida en la presente, la precisión está enlazada al número de muestras disponibles de cada tipo de tumor tal que la habilidad para clasificar tipos de tumor adicionales se logra fácilmente mediante la aplicación de números incrementados de cada tipo de tumor. Así mientras' que la invención es clasificada mediante el uso en la clasificación entre 34 o 39 tipos de tumor así como subconjuntos de los 34 o 39, 50 o más secuencias expresadas también pueden ser utilizadas para clasificar entre todos los tipos de tumor con la inclusión de muestras de los tipos de tumores adicionales. Así la invención también proporciona la clasificación de un tumor por ser de un tipo más allá de los 34 " o 39 tipos descritos en la presente. La invención está basada en los niveles de expresión de las secuencias de gen en un conjunto de células de tumor conocidas de diferentes tejidos y de diferentes tipos de tumor. Estos perfiles de expresión de gen (de secuencias de gen en las diferentes células/tipos de tumor conocidos) , ya sea englobados en la expresión de ácido nucleico, expresión de proteína u otros formatos de expresión se pueden comparar a los niveles de expresión de las mismas secuencias en una muestra de tumor desconocida para identificar la muestra y contiene un tumor de un tipo particular y/o un origen particular o tipo de célula. La invención proporciona, tal como en una instalación clínica, las ventajas de una identificación más precisa de un cáncer y de esta manera el tratamiento del mismo así como la prognosis, incluyendo la supervivencia y/o la probabilidad de recurrencia de cáncer después del tratamiento, del sujeto de quien se obtuvo la muestra. La invención además está basada en parte en el descubrimiento de que el uso de 50 o más secuencias expresadas como es descrito en la presente son capaces de la clasificación entre dos o más tipos de tumor necesariamente y efectivamente elimina uno o más tipos de tumor de la consideración durante la clasificación. Esto refleja la falta de una necesidad para seleccionar genes con niveles de expresión que son altamente correlacionados con todos los tipos de tumor dentro del intervalo del sistema de clasificación. Establecido diferentemente, la invención puede ser practicada con una pluralidad de genes, los niveles de expresión de los cuales no son altamente correlacionados con cualquiera de los tipos de tumor individuales o múltiples tipos en el grupo de tipos de tumor que son clasificados.
Esto está en contraste con otros procedimientos basados en la selección y el uso de genes altamente correlacionados, que probablemente no "excluyen" otros tipos de tumor como es opuesto a "incluir" un tipo de tumor basado en la correlación positiva. ' La clasificación de una muestra de tumor como que es uno de los tipos de tumor posibles descritos en la presente a la exclusión de otros tipos de tumor por supuesto se hac basado en un nivel de confidencia como es descrito enseguida. Donde el nivel de confidencia es bajo, un incremento en el nivel de confidencia es - preferido, la clasificación se puede hacer simplemente en el nivel de un origen de tejido particular o tipo de célula para el tumor en la muestra. Alternativamente, y donde una muestra de tumor no es fácilmente clasificada como un tipo de tumor individual, la invención permite la clasificación de la muestra como uno de unos cuantos tipos de tumor posibles descritos en la presente. Esto ventajosamente proporciona la habilidad para reducir el número de tipos de tejido posibles, tipos de células y tipos de tumor de los cuales considerar la selección y administración de terapia al paciente de quien se obtuvo la muestra. La invención así proporciona un medio no subjetivo para la identificación de la fuente de tejido y/o tipo de tumor de uno a más cánceres de un sujeto afligido. Donde la interpretación subjetiva puede haber sido utilizada previamente para determinar la fuente de tejido y/o tipo de tumor, así como la prognosis y/o el tratamiento del cáncer basado en esta determinación, la presente invención proporciona patrones de expresión de gen objetivos, que pueden ser utilizados solos o en combinación con criterios subjetivos para proporcionar una identificación más precisa de la clasificación de cáncer. La invención es particularmente de manera ventajosa aplicada a muestras de tumores secundarios o metastasizados, pero cualquier muestra que contiene células (incluyendo una muestra de tumor primario) para l.a cual la fuente de tejido y/o tipo de tumor es de preferencia determinada por criterios objetivos también puede ser utilizada con la invención. Por supuesto la determinación final de la clase puede ser en base a una combinación de criterios objetivos y no objetivos (o subjetivos/parcialmente subjetivos) . La invención incluye su uso como parte del cuidado clínico o médico de un paciente. Así, además de la utilización de una perfil de utilización de genes como es descrito en la presente para analizar una muestra que contiene células de un sujeto afligido con cáncer para determinar la fuente de tejido y/o tipo de tumor del cáncer, el perfil también puede ser utilizado como parte de un método para determinar la prognosis del cáncer en el sujeto. La clasificación del tumor/cáncer y/o la prognosis puede ser utilizada para seleccionar o determinar cual será el tratamiento terapéutico para el sujeto. Así los métodos de clasificación de la invención pueden ser dirigidos hacia el tratamiento de la enfermedad que es diagnosticada en conjunto o en parte basado en la clasificación. Dada la diagnosis, la administración de un agente antitumoral apropiado o terapia, o el mantenimiento o alternación de un agente antitumoral o terapia puede ser utilizado para tratar el cáncer. Otros métodos clínicos incluyen aquellos involucrados en la provisión del cuidado médico a un paciente basado en una clasificación como es descrito en la presente. En algunas modalidades, los métodos se relacionan a la provisión de servicios de diagnóstico basados en niveles de expresión de secuencias- de gen, con o sin inclusión de una interpretación de niveles para la clasificación de células de una muestra. En algunas modalidades, el método de provisión de un servicio de diagnóstico de la invención está precedido por una determinación de una necesidad por el servicio. En otras modalidades, el método incluye, actos en el monitoreo del desempeño del servicio así como actos en la petición o recepción del reembolso para el desempeño del servicio. Los detalles de una o más modalidades de la invención se exponen en el dibujo acompañante y la descripción siguiente. Oras características y ventajas de la invención serán evidentes a partir del dibujo y la descripción detallada, y a partir de las reivindicaciones. DEFINICIONES Como se utiliza en la presente, un "gen" es un polinucleótido que codifica ún producto discreto, ya sea RNA o de naturaleza - proteinácea. Se aprecia que más de un polinucleótido puede ser capaz de codificar un producto discreto. El término incluye alelos y polimorfismos de un gen que codifica el mismo producto, o un análogo funcionalmente asociado (incluyendo ganancia, pérdida o modulación de la función) del mismo, * basado en la localización cromosómica y la habilidad para recombinarse durante la mitosis normal. Una "secuencia" o "secuencia de gen" como se utiliza en la presente es una molécula de ácido nucleico de polinucleótido compuesto por un orden discreto de bases de nucleótido. El término incluye el ordenamiento de bases que codifica un producto discreto (es decir "región de codificación") ya sea de RNA o de naturaleza proteinácea. Se aprecia que más de un polinucleótido puede ser capaz de codificar un producto discreto. También se aprecia que los alelos y polimorfismos de las secuencias de gen humanas pueden existir y se pueden utilizar en la práctica de la invención para identificar el (los) nivel (es) de expresión de las secuencias de gen o un alelo polimorfismo de las mismas. Mediante la identificación de un alelo o polimorfismo depende en parte de la localización cromosómica y la habilidad para recombinarse durante la mitosis . Los términos "correlacionar" o "correlación" o equivalentes de los mismos se refieren a una asociación entre la expresión de uno o más genes y otro evento, tal como, pero no limitado a, fenotipo o característica fisiológica, tal como el tipo de tumor. Un "polinucleótido" es una forma polimérica de nucleótidos de cualquier longitud, ya sea ribonucleótidos o deoxirribonucleótidos . Este término se refiere solamente a la estructura primaria de la molécula. Así, este término incluye DNA de doble y de una sola hebra y RNA. Este también incluye tipos conocidos de modificaciones incluyendo marcas conocidas en la técnica, metilación "caps", sustitución de uno o más de los nucleótidos que ocurren naturalmente con un análogo y modificaciones de ínter nucleótído tales como enlaces no cargados (por ejemplo fosforotioatos, fosforoditioatos, etc.) así como formas no modificadas del polinucleótido. El término "amplificar" se utiliza en el sentido para dar entender que la creación de un producto de amplificación se pueda hacer enzimáticamente con DNA o RNA polimerasas. "Amplificación" como se utiliza en la presente, generalmente se refiere al proceso de producir múltiples copias de una secuencia deseada, particularmente aquellas de una muestra. "Múltiples copias" significa por lo menos 2 copias. Una "copias" no necesariamente significa la complementariedad o identidad de secuencia perfecta a la secuencia de plantilla. Los métodos para amplificar mRNA son generalmente conocidos en la técnica, e incluyen la PCR de trascripción inversa (RT-PCR) y PCR cuantitativa (o Q-PCR) o PCR en tiempo real. Alternativamente, RNA puede ser directamente marcado como el cDNA correspondiente por métodos conocidos en la técnica. Por "correspondiente" se propone que una molécula de ácido nucleico camparte una cantidad sustancial de identidad de secuencia con otra molécula de ácido nucleico. Cantidad sustancial significa por lo menos 95%, usualmente por lo menos 98% y más usualmente por lo menos 99%, y la identidad de secuencias se determina utilizando el algoritmo BLAST como es descrito en Altschul y colaboradores, (1990) , J. Mol. Biol. 215:403-410 (utilizando el conjunto de errores publicados, es decir parámetros de w=4, t=17) . Un "microarreglo" es un arreglo lineal o bidimensional o tridimensional (y de fase sólida) de regiones discretas, cada una que tiene una área definida,, formada en la superficie de un soporte sólido, tal como pero no limitado a, vidrio, plástico membrana sintética. La densidad de las regiones discretas sobre un microarreglo se determina por los números totales de polinucleótidos inmovilizados ' que son detectados sobre la superficie de una superficie de fase sólida individual, tal como de por lo menos aproximadamente 50/cm2, por lo menos aproximadamente 100/cm2 o por lo menos aproximadamente 500/cm2, hasta aproximadamente 1,000/cm2 o más alta. Los arreglos pueden contener menos de aproximadamente de 500, aproximadamente 1000, aproximadamente 1500, aproximadamente 2000, aproximadamente 2500 o aproximadamente 3000 polinucleótidos. inmovilizados en total. Como se utiliza en la presente, un microarreglo de DNA es un arreglo de oligonucleótido o sondas de polinucleótido colocadas sobre un chip u otras superficies utilizadas para hibridar a polinucleótidos amplificados o clonados de una muestra. Puesto que la posición de cada grupo particular de sondas en el arreglo es conocida, las identidades de polinucleótidos de una muestra puede ser determinada en base a su enlace a una posición particular en el microarreglo. Como una alternativa el uso de un microarreglo, un arreglo de cualquier tamaño puede ser utilizado en la práctica de la invención, incluyendo un arreglo de una o más posiciones de un arreglo bidimensional o tridimensional en una fase sólida para detectar la expresión de una secuencia de gen individual. En algunas modalidades, un microarreglo para el uso con la presente invención puede ser preparado mediante técnicas fotolitográficas (tal como la síntesis de sondas de ácidos nucleicos sobre la superficie del extremo 3' ) o mediante las síntesis nucleicas seguido por la deposición sobre una superficie sólida. Debido a que la invención depende de la identificación de la expresión de gen, algunas modalidades de la invención determinan la expresión mediante la hibridación de mRNA o una versión amplificada o clonada de la misma, de una célula de muestra a un polinucleótido que es único a una secuencia de gen particular. Los polinucleótidos de este tipo contienen por lo menos aproximadamente 16, por lo menos aproximadamente -18, por lo menos aproximadamente 20, por lo menos aproximadamente 22, por lo menos aproximadamente 24, por lo menos aproximadamente 26, por lo menos aproximadamente 28, por lo menos aproximadamente 30, por lo menos aproximadamente 32 pares de bases consecutivas de una secuencia de gen que no se encuentran en otras secuencias de gen. El termino "aproximadamente" como se utiliza en la oración previa se refiere un incremento de disminución de 1 a-partir del valor numérico establecido. Otras modalidades son polinucleótidos de por lo menos a aproximadamente 50, por lo menos aproximadamente 100, por lo menos o aproximadamente 150, por lo menos o aproximadamente 200, por lo menos o aproximadamente 250, por lo menos o aproximadamente 300, por lo menos o aproximadamente 350, por lo menos o aproximadamente 400, por lo menos o aproximadamente 450 o por lo menos aproximadamente 500 bases consecutivas de una secuencia que no se encuentra en otras secuencias de gen. El término "aproximadamente" como se utiliza en la oración precedente se refiere a un incremento de disminución de 10% ha partir del valor numérico establecido. Los polinucleótidos más largos por supuesto pueden contener desigualaciones menores (por ejemplo por la vía de la presencia de mutaciones) que no afecta la hibridación a los ácidos nucleicos de una muestra. -Tales polinucleótidos también pueden ser referidos como sondas de polinucleótido que • son capaces de hibridar a secuencias de los genes, o porciones únicas de las mismas, descritas en la presente. Tales polinucleótidos pueden ser marcados para existir en su detección. Las secuencias pueden ser aquellas de mRNA codificado por los genes, el cDNA correspondiente a tales mRNAs y/o versiones amplificadas de tales secuencias. En algunas modalidades de la invención, " las sondas de polinucleótido son inmovilizadas sobre un arreglo, otros dispositivos de soporte sólidos o en manchas individuales que localizan las sondas. En otras modalidades de la invención, toda o parte de una secuencia de gen puede ser amplificada y detectada por métodos tal como la reacción en cadena de polimerasa (PCR) y variaciones de la misma, tales como, pero no limitadas a, polimerasa, PCR cuantitativo (Q-PCR) PCR de trascripción inversa (RT.-PCR) y PCR en tiempo real (incluyendo como un medio para medir las cantidades iniciales de copias de mRNA para cada secuencia de una muestra) , opcionalmente RT-PCR en tiempo real o Q-PCR en tiempo real. Tales métodos utilizarían uno o dos cebadores que son complementarios a las porciones de una secuencia de gen, donde los cebadores se utilizan para cebar la síntesis, de ácido nucleico. Los ácidos nucleicos recientemente sintetizados de manera opcional son marcados y pueden ser detectados directamente- o mediante hibridación a un polinucleótido de la invención. Los ácidos nucleicos recientemente sintetizados pueden ser puestos en contacto con polinucleótidos (que contienen secuencias) de la invención bajo condiciones que permiten su hibridación. Métodos adicionales para detectar la expresión de ácidos nucleicos expresados incluyen los ensayos de protección de RNAsa, incluyendo las hibridaciones en fase liquida y la hibridación in situ de células. Alternativamente, y en modalidades adicionales de la invención, la expresión de gen puede ser determinada mediante el análisis de la proteína expresada en una muestra de células de interés mediante el .uso de uno o más anticuerpos específicos para uno o más epítopes de producto de gen individual (proteínas) o fragmentos proteolíticos de los mismos en la muestra de células o un fluido corporal de un sujeto. La muestra de células puede ser una de células epiteliales de cáncer de seno enriquecidas de la sangre de un sujeto, tal como mediante el uso de anticuerpos marcados contra marcadores de superficie celular seguido _ por la clasificación de células activada por fluorescencias. (FACS) . Tales anticuerpos pueden ser marcados para permitir su detección después del enlace al producto de gen. Las metodologías de detección adecuadas para el uso en la práctica de la invención incluyen, pero no están limitadas a, inmunohistoquímica de. muestras que contienen células o tejido, ensayos inmunosorbentes enlazados a enzima (ELISAs) incluyendo ensayos de intercalación de anticuerpo de tejido que contienen células o muestras de sangre, espectroscopia de masas e inmuno-PCR. Los términos "marca" o "marcado" se refiere a una composición capaz de producir una señal detectable "indicativa de la presencia de la molécula marcada. Las marcas adecuadas incluyen radioisótopos, cromóforos de nucleótidos, enzimas, sustratos, moléculas fluorescentes porciones quimioluminiscentes, partículas - magnéticas, porciones quimioluminiscentes y los similares. Como tal, una marca es cualquier composición detectable por medios espectroscópicos, fotoquímicos, bioquímicos, inmunoquí icos, eléctricos, ópticos o químicos . El término "soporte" se refiere a soportes convencionales tales como cuentas, partículas, varillas, fibras, filtros, membranas y soportes de silano de silicato tales como platinas de vidrio.
"Expresión" y "expresión de gen" incluyen la transcripción y/o traducción del material de ácido nucleico. Como se utiliza en la presente, el término "que comprende" y sus análogos se utilizan en su sentido inclusivo; esto es, equivalente al término "que incluye" y sus análogos correspondientes . Condiciones que "permiten" que un evento ocurra o condiciones que son "adecuadas" para que un evento ocurra, tal como la hibridación, extensión de la hebra y los similares, o condiciones "adecuadas" son condiciones que no impiden que tales eventos ocurran. Así, estas condiciones permiten, aumentan, facilitan y/o son conducentes al evento. Tales condiciones, conocidas en la técnica descritas en la presente, dependen de, por ejemplo, la naturaleza de las secuencia de nucleótidos, la temperatura de la condiciones de la solución reguladora. Estas condiciones también dependen de que evento es deseado, tal como la hibridación, segmentación, extensión de hebra o trascripción. "Mutación" de secuencia, como se utiliza en la presente, se refiere a cualquier alteración de la secuencia en la secuencia de un gen divulgado en la presente de interés en comparación en una secuencia de referencia. Una mutación de secuencia incluye cambios de nucleótidos individuales, o alteraciones de más de un nucleótido en una secuencia, debido a mecanismos tales como sustitución, supresión o inserción.
El polimorfismo de nucleótido individual (SNP) también es una mutación de secuencia como se utiliza en la presente. Debido a que la presente invención está basada en el nivel relativo de ' expresión de gen, las mutaciones en las regiones de no codificaciones de gen, es divulgado en la presente también pueden ser analizadas en la practica de la invención. "Detección" o "que detecta" incluyen cualquier medio para detectar, incluyendo la determinación directa e indirecta del nivel de expresión de gen y los cambios en la misma. A menos que se defina de otra manera todos los términos técnicos y científicos utilizados en la presente tienen el mismo significado como es comúnmente entendido para uno de habilidad ordinaria en la técnica a la cual esta invención pertenece. BREVE DESCRIPCIÓN DE LOS DIBUJOS La Figura 1 muestra una gráfica de capacidad para la habilidad para utilizar los niveles de expresión de subconjunto de un conjunto de 100 secuencias de gen expresadas para clasificar entre 39 tipos de tumor y subconjuntos de los mismos. Los niveles de expresión de combinación aleatorias de 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 y 100 (cada una muestreada 10 veces) de la 100 secuencias se utilizaron con datos de tipo de tumor y luego se utilizaron para predecir conjuntos aleatorios de pruebas de muestras -de tumor (cada una muestreada 10 veces) que varía de 2 a 39 tipos. Una gráfica de números de tipos de tumor contra precisiones de predicción para resultados utilizando de 50 a 100 genes se muestra como ejemplos no limitativos. Generalmente, la precisión se mejora con números más altos de secuencias de gen, donde 50 secuencias de gen da por resultado una producción más notable en la precisión cuando se utiliza con aproximadamente 20 o más tipos de tumor. La Figura 2 muestra una presentación alternativa de los datos utilizados con respecto a la Figura 1. Una gráfica de números de secuencias de gen utilizada, que varía de 50-100, contra precisión de predicción para varios números representativos de tipos de tumor es mostrada. Las líneas graficadas, de la parte superior al fondo, son de los resultados de 2, 10, 20, 30, y 39 tipos de tumor, respectivamente. La Figura 3 muestra el desempeño de la utilización de todos los genes de un primer conjunto de 74 secuencias de gen y un segundo conjunto de 90 secuencias de gen para clasificar varios números de tipos de tumor. Generalmente, la precisión de los dos conjuntos son muy similares, con el conjunto de 74 que exhibe una precisión más alta notable con aproximadamente 28 o más (hasta 39) tipos de tumor. La Figura 4 muestra una gráfica de capacidad para la habilidad para utilizarlo en niveles de expresión de todas o porciones de un primer conjunto de secuencias de 74 secuencias de gen expresadas para clasificar entre 39 tipos de tumor y subconjuntos de los mismos. Los niveles de expresión de combinaciones aleatorias de 50, 55, 60, 65, y 70 (cada una muestreada 10 veces) así como de todas las 74 de las secuencias se utilizaron con datos de tipo de tumor y luego se utilizaron para predecir los conjuntos aleatorios de pruebas de muestras de tumor (cada una muestreada 10 veces) que varía de 2 a 39 tipos. Una gráfica de números de tipos de tumor contra precisiones de predicción para resultados que utilizan de 50 a 74 genes se muestran como ejemplos no limitativos. Generalmente, la precisión se mejora con los números más altos de secuencias de gen, con el uso de 74 genes que son más notables por proporcionar las precisiones más altas, y 50 secuencias de genes que producen las precisiones más bajas, cuando se utiliza con aproximadamente 20 o más tipos de tumor. La Figura 5 muestra una presentación alternativa de los datos utilizados con respecto a la Figura 4. Una gráfica de números de secuencias de gen utilizados, que varía de 50-74, contra precisiones de predicción para varios números representativos de tipos de tumor es mostrada. Las líneas graficadas, de la parte superior al fondo, son de los resultados de 2, 10, 20, 30, y 39 tipos de tumor, respectivamente.
La Figura 6 muestra una gráfica de capacidad para la habilidad para utilizar los niveles de expresión de subconjuntos de un conjunto de 90 secuencias de gen expresadas para clasificar entre 39 tipos de tumor y subconjuntos de los mismos. Los niveles de expresión de combinaciones aleatorias de 50, 55, 60, 65, 70, 75, 80 y 85 (cada una muestreada 10 veces) así como de todas las 90 de las secuencias se utilizaron con datos de tipo de tumor y luego se utilizaron para predecir los conjuntos aleatorios de pruebas de muestras de tumor (cada una muestreada 10 veces) que varía de 2 a 39 tipos. Una gráfica de números de tipos de tumor contra precisiones de predicción para resultados que usan de 50 a 90 genes son mostradas como ejemplo no limitativos. Generalmente, la precisión se mejora con números más altos de secuencias de gen, donde 50 secuencias de gen da por resultado la precisión notablemente reducida cuando se utiliza con aproximadamente 20 o más- tipos de tumor. La Figura 7 muestra una presentación alternativa de los datos utilizados con respecto a la Figura 6. Una gráfica de números de secuencias de gen utilizadas, que varía de 50-90, contra precisiones de predicción para varios números representativos de tipos de tumor es mostrada. Las líneas graficadas, de la parte superior al fondo, son de los resultados de 2, 10, 20, 30, y 39 tipos de tumor, respectivamente.
Las Figuras 8A-8D muestran un "árbol" que clasifica los tipos de tumor cubiertos en la presente así como tipos de tumor conocidos adicionales. Este se construyó principalmente de acuerdo con "Cáncer, Principies y Practice of Oncology, (DeVito, Hellman y Rosenberg) 6a edición". Así comenzando con un "tumor de origen desconocido" (o "tuo") , las primeras posibilidades son que este es ya sea de una célula germinal o de origen de célula no germinal. Si 'este es el primero, entonces puede ser de origen de ovario o de testículo, dentro de aquellos de origen de testículo, el tumor puede ser de origen seminoma o de "otro" origen. Si el tumor es un origen de célula no germinal, entonces este ya sea de un origen epitelial o no epitelial. Si este es el primero, entonces ya sea de origen escamoso o no escamoso. Los tumores de origen escamoso son de cerviz, esófago, laringe, pulmón o de piel en origen. Los tumores de origen no escamoso son de origen de vejiga urinaria, seno, intestino carcinoide, colagiocarcinoma, digestivo, riñon, hígado, pulmón, próstata, sistema reproductor, célula basal de la piel o de origen papilar folicular de tiroides. Entre aquellos de origen digestivo, los tumores son del intestino delgado y grueso, adenocarcinoma de estómago, conducto biliar, esófago, vejiga biliar y páncreas en origen. Los tumores de origen de esófago pueden ser ya sea de esófago de Barrett o de tipos de adenocarcinoma. De los tumores de origen del sistema reproductor, ellos pueden .ser del tipo de adenocarcinoma de cerviz, tumor endometrial o de origen ovárico. Los tumores de origen ovárico son de los tipos claros, cerosos, mucinosos y endrometoides . Si el tumor es de origen no epitelial, entonces esté es de la glándula renal, cerebro, GIST (tumor estromal gastrointestinal) , linfoma, meningioma, mesotelioma, sarcoma, melanoma de la piel, u origen medular de tiroides. De los linfomas, ellos son de tipo célula B, de Hodgkin o de célula T. De los sarcomas, ellos son leimiosarcoma, osteosarcoma sarcoma de tejido blando, MFH' (histiocitoma fibroso maligno) de tejido blando, sarcoma sinovial de tejido blando, sarcoma de Ewing de tejido blando, fibrosarcoma de tejido blando y tipos de rabdomiosarcoma de tejido blando. DESCRIPCIÓN DETALLADA DE MODOS PARA PRACTICAR LA INVENCIÓN Esta invención proporciona métodos para el uso de la información de expresión de gen para clasificar tumores de una manera más objetiva que lo posible con las tecnologías de patologías convencionales. La invención está basada en parte a los resultados de reducir aleatoriamente el número de secuencias de gen utilizadas para el clasificar una muestra de tumor como uno de una pluralidad de tipos de tumor, tales como los 34 tipos de tumor descritos enseguida y en la solicitud provisional norteamericana 60/577,084, presentada el 4 de Junio del 2004. Un número total de 16,948 genes, que se filtraron de un conjunto más grande basado en la remoción de genes que exhiben señales bajas o constantes en las muestras utilizadas se utilizó tanto para la validación cruzada como las precisiones de predicción como es descrito en los ejemplos enseguida. 100 selecciones aleatorias de 50, 100, 150, 200, 250, 300, 400, 500, 600, 700, 800, 900, 1000, 1200, 1400, 1600, 18.00, 2000, 2200, 2400, 2600, 2800, 3000 y más genes del total se seleccionaron y se utilizaron para clasificación como es descrito en la presente. Así en un primer aspecto, la invención proporciona un método para clasificar una muestra que contiene células como que incluye una célula de tumor de (o de) un tipo de tejido ? de origen de tejido. El método comprende determinar o medir en los niveles de expresión de 50 o más secuencias transcritas de células en una muestra que contiene células obtenidas de un sujeto, y clasificar la muestra como que contiene células de tumor de un tipo de tejido de una pluralidad de tipos tumor basados en los niveles de expresión de las secuencias. Como se utiliza en la presente, "una pluralidad" se refiere al estado de dos o más. En algunas modalidades de la invención, la expresión de más de 50% de las secuencias transcritas no está correlacionada con la expresión de otra de la secuencias .transcritas; y/o las 50 o más secuencias transcritas no son • seleccionadas en base al aprendizaje supervisado utilizando muestras de tumor conocidos, en el nivel de correlación entre su expresión y la pluralidad de tipos de tumor en su clasificación y una correlación entre su expresión y la pluralidad de tipos de tumor. La clasificación está basada en una comparación de los niveles de expresión de las 50 o más secuencias transcritas en las células de la muestra a sus niveles de expresión en muestras de tumor conocidas y/o muestras no de tumor conocidas. Alternativamente la clasificación está basada en una comparación de los niveles de expresión de las 50 o más secuencias transcritas a la expresión de secuencias de referencia a las mismas muestras, con relación a, o basado en, la misma comparación en muestras de tumor conocidas y/o muestras no de tumor conocidas. Así como un ejemplo no limitativo, los niveles de expresión de las secuencias de gen se pueden determinar con un conjunto de muestras de tumor conocidas para proporcionar una base de datos contra la cual los niveles de expresión detectados o determinados en una muestra que contiene células de un sujeto es comparada. El (los) nivel (es) de expresión o secuencia (s) de gen en una muestra también puede ser comparada al (los) nivel (es) de expresión de la(s) secuencia (s) en células normales o no cancerosas, de preferencia de la misma muestra o sujeto. Como es descrito enseguida en las modalidades de la invención que utilizan Q-PCR o Q-PCR en tiempo real, los niveles de expresión pueden ser comparados a los niveles de expresión de genes de referencia en la misma muestra o una relación de niveles de expresión puede ser utilizada. La selección de 50 o más secuencias de gen para utilizar puede ser aleatoria, o mediante selección basada en varios criterios. Como un ejemplo no limitativo, las secuencias de gen pueden ser seleccionadas en base al aprendizaje no supervisado, incluyendo técnicas de agrupación. Como otro ejemplo no limitativo, la selección puede ser para reducir o remover la redundancia con respecto a su habilidad para clasificar el tipo de tumor. Por ejemplo, las secuencias de gen se seleccionan en base a la falta de correlación entre su expresión y la expresión de una o más de otras secuencias de gen utilizadas para la clasificación. Esto se realiza al estimar el nivel de expresión de cada secuencia de gen en el conjunto de datos de. expresión para la correlación, a través de la pluralidad de muestras, con el nivel de expresión de cada otro gen en el conjunto de datos para producir una matriz de correlación de coeficientes de correlación. Estas determinaciones de correlación se puede realizar directamente, entre la expresión de cada par de secuencias de gen, indirectamente, sin comparación directa entre los valores de expresión de cada par de secuencias de gen. Una variedad de metodologías de correlación se puede utilizar en la correlación de los datos de expresión de secuencias de gen individuales dentro del conjunto de datos. Ejemplos no limitativos que incluyen métodos paramétricos y no paramétricos así como metodologías basadas en la información mutua y los procedimientos no lineales. Ejemplos no limitativos de procedimientos paramétricos incluyen la correlación de Pearson (o Pearson r también referida como la correlación lineal o de producto-momento) y la correlación de coseno. Ejemplos no limitativos de métodos no paramétricos incluyen la correlación R de Spearman (u orden de clasificación) correlación de Tau de Kendall y la estadística Gamma. Cada metodología de correlación se puede utilizar para determinar el nivel de correlación entre las expresiones de secuencias de gen individuales en el conjunto de datos. La correlación de todas las secuencias con todas otras secuencias es más fácilmente considerada como una matriz. Utilizando la correlación de Pearson como un ejemplo no limitativo, el coeficiente de correlación r en el método es utilizado como el indicador del nivel de correlación. Cuando se utilizan otros métodos de correlación, el coeficiente de correlación análogo a r puede ser utilizado, junto con el reconocimiento de niveles equivalentes de correlación correspondientes a r que está en o aproximadamente 0.25 o que está en o aproximadamente 0.5. El coeficiente de correlación puede ser seleccionado como sea deseado para reducir el número de secuencias de gen correlacionadas a varios números. En algunas modalidades de la invención utilizando r, el valor de coeficiente seleccionado puede ser de aproximadamente 0.25 o más alto, aproximadamente 0.3 o más alto, aproximadamente 0.35 o más alto, aproximadamente 0..4 o más alto, aproximadamente 0.45 o más alto, aproximadamente 0.5 o más alto. La selección de un valor de coeficiente significa que donde le expresión de secuencias de gen en el conjunto de datos está correlacionada en ese valor o más alto, ellos son posiblemente no incluidos en un subconjunto de la invención. Así en algunas modalidades el método comprende excluir o remover (no utilizando la clasificación) una o más secuencias de gen que son expresadas en correlación, arriba de un coeficiente de correlación deseado, con otra secuencia de gen en el conjunto de datos del tipo de tumor. Se puntualiza, sin embargo, que. pueden haber situaciones de secuencias de gen que no son correlacionadas con cualquiera de otras secuencias de gen, caso en el cual ellas no son necesariamente removidas para el uso de la clasificación. Así los niveles de expresión de las secuencias de gen, donde más de 10%, más de aproximadamente 20%, más de aproximadamente 30%, más de aproximadamente 40%, más de aproximadamente 50%, más de aproximadamente 60%, más de aproximadamente 70%, más de aproximadamente 80% o más de aproximadamente 90% de los niveles no son correlacionados con aquel de- otro de las secuencias de gen utilizadas, se puede utilizar en la práctica de la- invención. La correlación entre los niveles de expresión se puede basar en un valor por debajo de aproximadamente 0.9 aproximadamente 0.8 aproximadamente 0.7 aproximadamente 0.6 aproximadamente 0.5 aproximadamente 0.4 aproximadamente 0.3 aproximadamente 0.2. La habilidad para clasificar entre las clases con exclusión de los niveles de expresión de algunas secuencias de gen está presente debido a que las secuencias del gen en el subconjunto está correlacionada con la expresión de secuencias de gen excluidas del subcorijunto . Así nada de información se perdió debido a que la información basada en la expresión de las secuencias de gen excluida es todavía representada por la secuencia excluidas en el subconjunto. Por lo tanto, la expresión de las secuencias de gen del subconjunto tiene - contenido información relevante a las propiedades y/o características (o fenotipos) de una célula. Este tiene aplicación ' y relevancia a la clasificación de las clases adicionales de tipo de tumor no incluidas como parte del conjunto de datos de expresión del gen original que pueden ser clasificados mediante el uso de un subconjunto de la invención debido a que está basado en la redundancia de información entre la expresión de secuencias en el subconjunto y las secuencias expresadas en esas clases adicionales. Así la invención puede ser utilizada para clasificar células como que son de un tipo de tumor más allá de la pluralidad de clases conocidas utilizadas para generar el conjunto de datos de expresión de gen original. La selección de secuencias de gen basado en la reducción de la correlación de expresión a un tipo de tumor particular también puede ser utilizada. Esto también refleja un descubrimiento de la presente invención, basado en la observación de que los niveles de expresión que fueron más altamente correlacionado con uno o más tipos de tumor no fue necesariamente de valor más grande en la clasificación entre diferentes tipos de. tumor. Esto se refleja tanto por la capacidad para utilizar secuencias de gen aleatoriamente seleccionadas para la clasificación así como el uso de secuencias particulares, como es descrito en la presente, que no son expresadas con la correlación más significante con uno o más tipos de tumor. Así la invención puede ser practicada sin selección de secuencias de gen basado en los valores P más significantes a una clasificación basada en la correlación de la expresión de gen y uno o más tipos de tumor. Así la invención puede ser practicada sin el uso de metodologías basadas en clasificación tal como la prueba H Kruskal-Wailis. Las secuencias de gen utilizadas en la práctica de la invención pueden incluir aquellas que se han observado que son expresadas en correlación con tipos de tumor particulares, tal como la expresión del receptor de estrógeno, que se ha observado que es expresado en correlación con algunos cánceres de seno y ovario. En algunas modalidades de la invención, sin embargo la invención es practicada con el uso del nivel de expresión de por lo menos una secuencia de gen que no se ha identificado previamente, es asociada con cualquiera de los tipos de tumor que son clasificados. Así la invención puede ser practicada si en todas las secuencias de gen que se han asociado previamente o . correlacionado con la expresión en los 2 o más (hasta 39 o más) tipos de tumor a los cuales una muestra que contiene células puede ser clasificada. Mientras que la invención se describe principalmente con respecto a sujetos humanos, también se pueden utilizar muestras de otros sujetos. Todo lo que es necesario es la habilidad para estimar los niveles de expresión dé las secuencias de gen en una pluralidad de muestras de tumor conocidas tal que los niveles de expresión • en una muestra no conocido de prueba pueden ser comparados. Así la invención puede ser aplicada a muestras de cualquier organismo para el cual una pluralidad de secuencias expresadas, y una pluralidad de muestras de tumor conocidas están disponibles, un ejemplo no limitativo es la aplicación de la invención a muestras de ratón, basada en la disponibilidad del genoma de ratón para permitir la detección de secuencias de murino expresadas y la disponibilidad de las muestras de tumor de ratón conocidas o la habilidad para obtener muestras conocidas. Así, la invención se contempla para el uso con otras muestras, incluyendo aquellas de mamíferos, primates y animales utilizados en la prueba clínica (tales como ratas, ratones, conejos, perros, gatos y chimpancés) como ejemplo no limitativo. Mientras que la invención es fácilmente practicada con el uso de muestras que contienen células, cualquier muestra que contiene ácido nucleico que pueda ser analizada para los niveles de expresión de gen puede ser utilizada en la práctica de la invención. Sin limitar la invención, una muestra de la invención puede ser una que se sospecha o que se conoce que contiene células de tumor. Alternativamente, una muestra la invención puede ser "muestra de tumor" o "muestra que contiene tumor" o "muestra que contiene células de tumor" de tejido o fluido aislado de un individuo que se sospecha de ser afligido con, o en riesgo de desarrollar, cáncer. Ejemplos no imitativos de muestras para el uso con la invención incluyen una muestra clínica, tal, pero no limitada a una muestra fijada, a una muestra fresca ó una muestra congelada. La muestra puede ser un espirado, o una muestra citológica (incluyendo sangre u otro fluido corporal) o una muestra de tejido, que incluye por lo menos algo de información que considera el contexto in situ de células en la muestra, mientras que las células apropiadas o ácidos nucleicos estén disponibles para la determinación de los niveles de expresión de gen. La invención está basada en parte en el descubrimiento de que los resultados obtenidos con las secciones de tejido congelado se pueden aplicar validamente a la situación con el tejido fijado a las muestras de células y extendidas a muestras frescas. Ejemplos no limitativos de muestras fijadas incluyen aquellas que son fijadas con formalina o formaldehído (incluyendo muestras FFPE) con Boudi's, glutaldeído, acetona, alcoholes o cualquier otro fijador tales como aquellos utilizados para fijar muestras de células o de tejido para inmunohistoquímica (IHC) . Otros ejemplos incluyen fijadores que precipitan los ácidos nucleicos y proteínas asociados con las células. Dadas las' complicaciones posibles eh el manejo de muestras de tejido congelado, tal como la necesidad para mantener su estado congelado, la invención puede ser practicada con muestras no congeladas, tales como muestras fijadas, muestras frescas, que incluyen células de sangre u otro fluido corporal o tejido, y muestras mínimamente tratadas . En algunas aplicaciones de la invención, la muestra no se ha clasificado utilizando las técnicas de patologías estándares tales como,- pero no limitadas a, ensayos basados en inmunohistoquímica.
En algunas modalidades de la invención, la muestra se clasifica como que contiene una célula de tumor de un tipo seleccionado de los siguientes 53 y subconjuntos de los mismos: Adenocarcinoma de seno, Adenocarcinoma de cerviz, Adenocarcinoma de Esófago, Adenocarcinoma de Vesícula Biliar, Adenocarcinoma de Pulmón, Adenocarcinoma de Páncreas, Adenocarcinoma de Intestino Delgado-Grueso, Adenocarcinoma de Estómago, Astrocitoma, Carcinoma de Célula Basal de lá Piel,-Colangiocarcinoma de Hígado, Adenocarcinoma de Célula Clara de Ovario, Linfoma de Célula B Grande Difusa, Carcinoma Embrional .de Testículo, Carcinoma endometroide de Útero, Sarcoma de Ewings, Carcinoma Folicular de Tiroides, Tumor Estromal Gastrointestinal, Tumor de Célula Germinal de Ovario, Tumor Celular Germinal de Testículo, Leoblastoma Multiforme, Carcinoma Hepatocelular de Hígado, Linfoma de Hodgkin, Carcinoma de Célula Grande de Pulmón, Leiomiosarcoma, Liporsacoma, Carcinoma Lobular de Seno, Histiocitoma Fibroso Maligno, Carcinoma Medular de Tiroides, Melanoma, Meningioma, Mesotelioma de Pulmón, Adenocarcinoma Mucinoso de Ovario, Miofibrosarcoma, Tumor Neuroendocrino de Intestino, Oligodendroglioma, Osteosarcoma, Carcinoma Papilar de Tiroides, Feocromocitoma, Carcinoma de Célula Renal de Riñon, Rabdomiosarcoma, Seminoma de Testículo, Adenocarcinoma Seroso de Ovario, Carcinoma de CélulOa Pequeña de Pulmón, Carcinoma de Célula Escamosa de Cerviz, Carcinoma de Célula Escamosa de Esófago, Carcinoma de Célula Escamosa de Laringe, Carcinoma de Célula Escamosa de Pulmón, Carcinoma de Célula Escamosa de Piel, Sarcoma Sinovial, Linfoma de Célula T y Carcinoma de Célula Transicional de Vejiga. En otras modalidades de la invención, la muestra se clasifica como que contiene una célula de tumor de un tipo seleccionado de los siguientes 34 y subconjuntos de los mismos: adrenal, cerebro, seno, intestino carcinoide, cerviz (célula escamosa) , colangiocarcinoma, endometrio, célula germinal, JIST (tumor estromal gastrointestinal) riñon, leiomiosarcoma, hígado, pulmón (adenocarcinoma, célula grande) , pulmón (célula pequeña) , pulmón (escamoso) pulmón, linfoma (célula B) , linfoma (Hodgkins) miningiona, mesotelioma, osteosarcoma, ovario (célula clara) ovario (célula serosa) páncreas, próstata, piel (célula basal) , piel (melanoma) , intestino delgado y grueso; tejido blando (liporsacoma) ; tejido blando (MFH o Histiocitoma Fibroso Maligno) , tejido blando (Sarcoma-sinovial) testículo (seminoma) , tiroides (folicular-papilar) , tiroides (carcinoma medular) y vejiga urinaria. En modalidades seleccionadas de la invención, la muestra se clasifica como que contiene una célula de tumor de un tipo seleccionado de los siguientes 39, es subconjuntos de los mismos: glándula drenal, cerebro, seno, intestino carcinoide, adenocarcinoma de cerviz, cerviz escamoso,' endometrio, vesícula biliar, ovario de célula germinal GIST riñon, leimiosarcoma hígado, célula grande de adenocarcinoma de pulmón, célula pequeña de pulmón, pulmón escamoso, célula B de linfoma, linfoma de Hodgkin, célula T de linfoma, meningioma, mesotelioma, osteosarcoma, célula clara de ovario, ovario seroso, páncreas, próstata, célula basal de la piel, melanoma de la piel, piel escamosa, intestino delgado y grueso, liposarcoma de tejido blando, MFH de tejido blando, sarcoma sinovial de tejido blando, adenocarcinoma de estómago, testículos otros (o no seminoma) testículo-seminoma, tiroides-folicular-papilar, tiroides-medular y vejiga urinaria. Los métodos de la invención también se pueden aplicar para clasificar una muestra que contiene células, que contiene célula de tumor de un tumor de un subconjunto de cualquiera de los conjuntos anteriores. El tamaño del subconjunto usualmente será pequeño, compuesto de dos, tres, cuatro, cinco, seis, siete, ocho, nueve o diez de los tipos de tumor descritos en lo anterior. Alternativamente, el tamaño del subconjunto puede ser cualquier número integral de este tamaño completo del conjunto. Las modalidades de la invención incluyen la clasificación entre 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43,' 44, 45, 46, 47, 48, 49, 50, 51 o 52 de los tipos anteriores. En algunas modalidades, el subconjunto será compuesto de tipos de tumor que son del mismo tipo de tejido u órgano. Alternativamente, el subconjunto será compuesto de tipos de tumor de diferente tejidos u órganos. En algunas modalidades, el subconjunto incluirá uno o más tiempos seleccionados de glándula drenal, cerebro, intestino carcinoide, adenocarcinoma de cerviz, cerviz escamoso, vesícula biliar, célula germinal-ovario, GIST, lei iosarcoma, hígado, meningioma, osteosarcoma, célula basal de la piel, piel escamosa, liporsacoma de tejido- blando, MFH de tejido blando, sarcoma-sinovial de tejido blando, testículo-otro (o no seminoma) testículo-seminoma, tiroides-folicular-papilar y tiroides-medular . La clasificación entre los subconjuntos de los tipos de tumor anteriores se demuestra por los resultados mostrado en las Figuras 1 y 2, donde los niveles de expresión de tan pocos como 50 • o más secuencias de gen se pueden utilizar para clasificar entre muestras aleatorias de 2 tipos de tumor entre aquellas en el conjunto de 39 listados en lo anterior. Los niveles de expresión de 50-100 secuencias de gen (que se seleccionaron aleatoriamente) se puede utilizar para clasificar entre 2 a 39 tipos de tumor con grados variantes de precisión. La invención puede ser practicada con los niveles de expresión ' de 50 o más, aproximadamente 55 o más, aproximadamente 60 o más, aproximadamente 65 o más, aproximadamente - 70 o más, aproximadamente 75 o más, aproximadamente 80 o más, aproximadamente 85 o más, aproximadamente 90 o más, aproximadamente 100 - o más, aproximadamente 110' o más, aproximadamente 120 o .más, aproximadamente 130 o más, aproximadamente 140 o más, aproximadamente 150 o más, aproximadamente 200 o más, aproximadamente 250 o más, aproximadamente 300 o más, aproximadamente 350 o más, aproximadamente 400 o más secuencias transcritas ' como se encuentran en el "trascriptoma" humano (porción transcrita del genoma) . La invención también puede ser practicada con niveles de expresión de 50-60 o más, aproximadamente 60-70 o más, aproximadamente 70-80 o más, ' aproximadamente 80-90 o más, aproximadamente 90-100 o más, aproximadamente 100-110 o más, aproximadamente 110-120 o más, aproximadamente 120-130 o más, aproximadamente 130-140 o más secuencias transcritas. En algunas modalidades de la invención, los genes transcritos pueden ser recolectados aleatoriamente o incluir todos o algunos de las secuencias de gen específicas divulgadas en la presente. Como se muestra en la presente, la clasificación con presiones de aproximadamente 55%, o aproximadamente 60% , o aproximadamente 65%, o aproximadamente 70%, o aproximadamente 75%, o aproximadamente 80%, o aproximadamente 85%, o aproximadamente 90%, o aproximadamente 95% o más altas pueden ser realizadas mediante el uso de la presente invención. En otras modalidades más. los niveles de expresión de gen de las otras secuencias de gen se pueden determinar junto- con las determinaciones descritas en lo anterior de los niveles de expresión para el uso de la clasificación. Un ejemplo no limitativo de esto se observa en el caso de una plataforma basada en microarreglo para determinar .la expresión de gen, donde la expresión de otras secuencias de gen también es medida. Donde esos otros niveles de expresión o se utiliza en la clasificación como ellos se pueden considerar los resultados de las secuencias transcritas en "exceso" y no crítico para la practica ' de la invención. Alternativamente, y donde esos otros nímbeles de expresión son utilizados en la clasificación, ellos están dentro del alcance de la invención, donde la descripción de la utilización de húmeros particulares de secuencias no necesariamente excluyen el uso de niveles de expresión de las secuencias adicionales. En algunas modalidades, la invención excluye el uso de nivele (s) de expresión de una o más secuencias de gen en "en exceso", tales como aquellas que pueden proporcionar información redundante a una o más de otras secuencias de gen utilizadas en un método de la invención. Debido a que la clasificación de una muestra como que contiene células de uno de los tipos de tumor anteriores evidentemente también clasifica el origen del -sitio de tejido órgano de la muestra, los métodos de la invención se pueden aplicar a la clasificación de una muestra de tumor como que son de un sitio de un tejido órgano particular del paciente. Esta aplicación de la invención es particularmente útil en casos donde la muestra de un tumor que es el resultado de la metástasis por otro tumor. En algunas modalidades de la invención, la muestra de tumor se clasifica por ser uno de los siguientes 24: adrenal, vejiga, hueso, cerebro, seno, cerviz, endometrio, esófago, vesícula biliar, riñon, laringe, hígado, pulmón, nudo de linfa, ovario, páncreas, próstata, piel, tejido blando, intestino delgado/grueso, estomago, testículo, tiroides y útero. Mientras que la invención también .proporciona la clasificación como uno de los tipos de tumor anteriores basados en las comparaciones a los niveles de expresión de secuencias en los 39 tipos de tumor/ es posible que el nivel más alto en confidencia en la clasificación sea deseado. Si un incremento en la confidencia de la clasificación es preferido, la clasificación puede ser ajustada para identificar la muestra de tumor como que es de origen particular de un tipo de célula como se muestra en la Figura 8. Así un incremento en la confidencia se puede hacer en el intercambio para una disminución en especificidad en cuanto al tipo de tumor mediante la identificación del origen o tipo de célula. La clasificación de una- muestra que contiene células como que tiene una célula de tumor de uno de los 39 tipos de tumor anteriormente inherentemente también clasifica el tejido u origen de sitio de órgano de la muestra. Por ejemplo, la identificación de una muestra como que es cerviz escamosa necesariamente clasifica el tumor como que es de origen servicial, tipo de células escamosa (y así epitelial antes que nueve epitelial en origen) como se muestra en la Figura 8. Esto también significa que el tumor fue necesariamente no de célula germinal en origen. Así, el método de la invención se puede aplicar a la clasificación de una muestra de tumor como que es de un tejido particular o sitio de órgano de un sujeto o paciente. Esta aplicación de la invención es particularmente útil en caso en donde la muestra es de un tumor que es resultado de la metástasis por otro tumor. La practica de la invención para clasificar una muestra que contiene células como que tiene unas células de tumor de uno de los tipos anteriores es mediante el uso de un algoritmo de clasificación apropiado que utiliza el aprendizaje supervisado para aceptar 1) los niveles de expresión de las secuencias de gen en una pluralidad de tipos de tumor conocidos como un conjunto de entrenamiento y 2) los niveles de expresión de los mismos genes en una .o más células de una muestra para clasificar la muestra como que tiene células de uno de los tipos de tumor. Discusión adicional de esto se proporciona en la sección de ejemplos en la presente. Los niveles de expresión se pueden proporcionar en base a las señales en cualquier formato, incluyendo la expresión de ácido' nucleico o la expresión de proteína, ya descrita en la presente. Como sería evidente para el profesional experto, el intervalo de clasificación es afectado por el número de tipos de tumor así como el número de muestras para cada tipo de tumor. Pero dada las muestras adecuadas del intervalo completo de tumores humanos como se proporciona en la presente invención, la invención - es fácilmente aplicada a la clasificación de esos tipos de tumor así como tipos adicionales. Ejemplos no limitativos de algoritmos de clasificación que pueden ser utilizados en la practica de la invención incluyen algoritmos de aprendizaje supervisado, algoritmos de aprendizaje de maquina, análisis discriminante lineal, algoritmos de selección de atributo, redes neurales artificiales (ANN) . En modalidades preferidas de la invención, un algoritmo de clasificación basado en distancia, tal como el algoritmo de vecino k-mas cercano (KNN) o maquina de vector de soporte (SVM) son utilizados. El uso de KNN es en algunas modalidades de la invención es discutido convencionalmente como un ejemplo representativo no limitativo. KNN se puede utilizar para analizar los datos de expresión de los genes en un "conjunto de entrenamiento" de muestras de tumor conocidas incluyendo todos los 39 de los tipos de tumor descritos en la presente. El conjunto de datos de entrenamiento luego puede ser comparado a los datos de expresión para los mismos genes en una muestra que contiene células. Los niveles de expresión de los genes en la muestra luego se comparan al conjunto de datos de entrenamiento por la vía de KNN para identificar aquellas muestras de tumor con los patrones de expresión más similares. Como un ejemplo no limitativo, los cinco "vecinos más cercanos" pueden ser identificados en los tipos de tumor de mismos utilizados para clasificar la muestra de tumor no conocida. Por supuesto otros números de "vecinos más cercanos" pueden ser utilizados. Ejemplos no limitativos incluyen menos de 5, aproximadamente 7, aproximadamente 9 o aproximadamente 11 o más "vecinos más cercanos". Como un ejemplo hipotético, si los cinco "vecinos más cercanos" de una muestra no conocida son cuatro linfomas de célula B y un linfoma de célula T, entonces la clasificación de la muestra como que es de un linfoma de célula B que se puede hacer con gran precisión. Esto se ha utilizado con 84% o más grande precisión, tal como 90%, como es descrito en los ejemplos.
La habilidad de clasificación se puede combinar con la naturaleza inherente del esquema de clasificación para proporcionar un medio para incrementar la confidencia de la clasificación de tumores en ciertas situaciones. Por ejemplo, si los cinco "vecinos más cercanos" de una muestra son tres células claras de ovario y dos tumores cerosos de ovario, la confidencia se puede mejorar al tratar simplemente los tumores como que son de. origen ovárico y al tratar el sujeto o paciente (de quien se obtuvo la muestra) por consiguiente. Ver la Figura 8. Esto es un ejemplo de especificidad de intercambio en un favor de la confidencia incrementada. Esto proporciona el beneficio agregado de dirigir la posibilidad de que la muestra desconocida fue un tumor mucinoso endometroide . Por supuesto el profesional exp.erto está libre para tratar el tumor- como una o ambas de estás dos posibilidades más probables y proceder de acuerdo con esa determinación . Debido a que el linaje de desarrollo de las células de tumor en ciertos tipos de tumores (por ejemplo células germinales) puede ser compiejo e involucrar múltiples tipos de células, la Figura 8 puede aparecer que es sobresimplificada. Sin embargo, esto sirve como una buena base para relacionar la histopatología conocida y para servir como un "árbol de guía" para analizar y relacionar las señales de expresión del gen asociado al tumor.
La naturaleza inherente del esquema de clasificación también proporciona un medio para incrementar la confidencia de la clasificación de tumor en caso en donde los "vecinos más cercanos" son ambiguos. Por ejemplo, si los cinco "vecinos más cercanos" fueron uno de vejiga urinaria, uno de seno, uno de riñon, uno de hígado y uno de próstata, la clasificación simplemente puede ser aquella de un tumor de célula no escamosa. Tal determinación se puede hacer con confidencia significante y el sujeto o paciente de quien se obtuvo la muestra se puede tratar por consiguiente. Sin que sea relacionado por la teoría, y ofrecido solamente para mejorar el entendimiento de la invención, los últimos dos ejemplos reflejan las similitudes en la expresión de gen de células de un tipo de célula similar y/u origen de tejido. Las modalidades de la invención incluyen el uso de los métodos y materiales descritos en la presente para identificar el origen de un cáncer de un paciente. Así, dada una muestra que contiene células de tumor, el origen de tejido de las células de tumor se identifica mediante el uso de la presente invención. Un ejemplo no limitativo está en el caso de un sujeto con un nudo de linfa inflamado que contiene células de cáncer. Las células pueden ser de un tejido u órgano que drena en el nodo de linfa o puede ser de otra fuente de tejido. La presente invención se puede utilizar para clasificar las células como que son de un tumor o tipo de tejido particular (u origen) que permite la identificación de la fuente de las células de cáncer. En un ejemplo no limitativo alternativo, la muestra (tal como aquella de un nodo de linfa) contiene células, que primero se analizan mediante el uso de la invención para clasificar por io menos una célula como que es una célula de tumor de un tipo de tejido u origen. Esta luego se utiliza para- identificar la fuente de las células de cáncer en la muestra. Ambos de estos son ejemplos del uso ventajoso de la invención para ahorrar tiempo, esfuerzo y costo en el uso de otras pruebas de diagnóstico de cáncer. En modalidades adicionales, la invención se practica con una muestra de un sujeto con una historia previa ' de cáncer. Como un ejemplo no limitativo, una muestra que contiene células, (del nodo de linfa o de otra parte) del sujeto se puede encontrar que contiene células de cáncer tal que la presente invención se puede utilizar para determinar si las células son del mismo o un tejido diferente de aquel del cáncer previo. La aplicación de la invención también se puede utilizar para identificar un nuevo tumor primario, tal como el caso donde nuevas células de cáncer se encuentran en el hígado de un sujeto quien previamente tuvo cáncer de seno. La invención se puede utilizar para identificar las nuevas células de cáncer como que son el resultado de la metástasis del - cáncer de seno previo (o de otro tipo de tumor, ya sea previamente identificado o no identificado) o como una nueva ocurrencia primaria de cáncer de hígado. La invención también puede ser aplicada a muestras de un tejido u órgano donde múltiples cánceres se encuentran que determinan el origen de cada cáncer, así como si los cánceres son del mismo origen. Mientras que la invención puede ser practicada con el uso de niveles de expresión de un grupo aleatorio de secuencias de genes expresadas, la invención también proporciona secuencias de gen ejemplares para el uso en la práctica de ia invención. • La invención incluye un primer grupo de 74 secuencias de gen de las cuales 50 o más pueden ser utilizadas en la práctica de la invención. Las 50 a 74 secuencias de gen pueden ser utilizadas junto con la determinación de los niveles de expresión de secuencias adicionales mientras que los niveles de expresión de las secuencias de gen de conjunto de 74 se utilizan en la clasificación. Un ejemplo no limitativo de tales modalidades de la invención es donde la expresión de las 74 secuencias de gen, o por lo menos 50 (o 50 o aproximadamente 90) miembros de las mismas, se mide junto con los niveles de expresión de una pluralidad de otras secuencias, tal como mediante el uso de una plataforma basada en microarreglo utilizada para realizar la invención. Donde esos otros niveles de expresión no se utilizan en la clasificación, ellos se pueden considerar los resultados de las secuencias transcritas "en exceso" y no críticas para la práctica de la invención. Alternativamente, donde esos otros niveles de expresión se utilizan en la clasificación, ellos están dentro del alcance de la invención, donde el uso de las secuencias descritas en lo anterior no necesariamente excluyen el uso de niveles de expresión de secuencias adicionales. Las secuencias de mRNA' correspondientes a un conjunto de 74 secuencias de gen para el uso en la práctica de la invención se proporcionan en el listado de secuencias adjunto. Un listado de las SEQ ID NOs, con información de identificación correspondiente, incluyendo los números de acceso y otra información, se proporciona por lo siguiente. >Hs.73995_mRNA_l gi | 190403 | gb|M60502.1 JHOMPROFIL? Human profilaggrin rr_RNA, 3' end polyÁ=l (SEQ ID NO:l) >Hs.75236_mRNA_4 gi 114280328 jgb "¡AY033998.1 j Homo sapiens polyA=3 (SEQ ID NO: 2) >Hs.299867_mRNA_l gi | 4758533 | ref |NM_004496.1 | Homo sapiens hepatocyte nuclear factor 3, alpha (HNF3A) , mRNA polyA=3 (SEQ ID NO:3) >Hs .285 01_contigl AI14792S|AI880620|AA768316|AA761543|AA279147|AI21S016|AI738663|N79248|AI68 4489 iAA9S0845 ] I718599 | I379138 |N29366 |BP002S07 |AW044269 |R34339 ¡R66326 |H04 S48|R67467|AI523112|BF941500 polyÁ=2 polyA=3 (SEQ ID NO:4) >Hs.l82507_mKNA_l gi | 15431324 | ef |NM_002283.2 | Homo sapiens eratin, hair, basic, 5 (KRTHB5) , mRNA polyA=3 (S?Q ID NO:5) >Hs .292653_contigl AI2006S0|AW014007|AI341199¡AI692279|AI393765|AI378686|AI695373|AW292108|T1 0352|R44346|AW470408|AI380925|BF938983|A 003704|H08077|F03856|H08075|F0889 5|A 468398|AI865976!H22568|AI858374|AI2-16499 polyA=2 polyA=3 (SEQ ID NO: 6) >Hs.97616_mRNA_3 gi ¡ 1265485 |gb|BC001270.1 [BC001270 Homo sapiens clone MGC:5069 IMAGE: 3458016 polyA=3 (SEQ ID NO: 7) >Hs.l23078_mRNA_3 gi 114328043 |gb|BC009237.1 |BC009237 Homo sapiens clone MGC:2216 IMAGE : 2989823 polyA=3 (SEQ ID NO:8) >Hs.285508_contigl A 194680 |BF93974 |BF516467 polyA=l polyA=l (SEQ ID NO: 9) >Hs .183274_contigl BF437393 |BF064008 ¡BF509951 |A 134603 |AI277015 | I803254 |AA887915 |BF054958 |AI 004413|AI39391l|AI278517|AW612644|AI492162lAI309226|AI86367l|AA448864|AI64 0165|AA479926JAA461188|AA78016l|BF59118?|AI91802 ¡AI758226|AI291375JBF0018 45|BF003064|AI337393JAI522206|BE856784JBF001760|AI280300 FLAG=1 polyA=2 WARN polyA=3 (SEQ ID NO:10) >Hs .334841_mRNA_3 gi ] 14290606 | gb|BC009084.1 |BC009084 Homo sapiens clone MGC:9270 IMAGE: 3853674 polyA=3 (SEQ ID NO: 11) >Hs .3321_Contigl AI804745 |AI492375 ¡ A594799 |B?672611 |AA814147 |AA722404 |AW170088 JD11718 ¡BG15 3444|AI680648|AA06356l|BE219054|AI590287|R55185lAI479167|AI796872|AI018324 |AI701122 |BE218203 |AA905336 |AI681917 [BI084742 |AI480008 JAI21799 |AI401468 polyA=2 polyA=3 (SEQ ID NO: 12) >Hs.306216_SÍngletl A 083022 polyA=l polyA=2 (SEQ ID N0:13) >Hs.99235_contigl AA456140 |AI167259 ]AA450056 polyA=2 polyA=3 (SEQ ID NO: 14) >Hs.l69172_mRNA_2.gi-| 22749611 emb |AJ000388.1 |HSCANPX Ho o sapiens mRNA for calpain-'like protease CANPX polyA=3 (SEQ ID NO: 15) >Hs.351486_mRNA__l gi 116549178 | bj |AK054605.1 JAK054605 Homo'sapiens cDNA FIuT30043 fis, clone 3NB692001548 polyA=0 (SEQ ID NO:16) >Hs .153504_contig2 BE962007|AW016349|A 016358]A 139144¡AA932969|AI025620 j I688744 | I865632 | A 8542911 AA932970 |AU156702 | I634439 | A152496 |AI539557 | I123490 | I613215 | I31 8363 |A 105672 ¡AA843483 ¡AI36688 |A 181938 jAI813801 ¡AI433695 | AA934772 JN72230 JAI760632jBE8589'65 | 058302 ] I760087 |AI682077 |AA886672 |AI350384 |A 243848 |A W300574|BE466359|AI859529JAI921588|BF062899|BE855597|BE617708 polyA=2 polyA=3 (SEQ ID NO: 17) >Hs.l99354_singletl AI669760 polyA=l polyA=2 (SEQ ID NO.-18) >Hs.l62020_contigl AW291189|AA505872 polyA=2 polyA=3 (SEQ ID NO-.19) >Hs.30743__mRNA_3 gi ] 18201906 | ref |NM_006115.2 | Homo sapiens preferentially expressed antigen in melanoma (PRAME) , mENA polyA=3 (SEQ ID NO:20) >Hs .271580_contigl AI632869|AW338882¡AW338875|AV.613773)AI982899|A 19315l|BE206353|B?2082O0|AI 811548 |AW264021 polyA=2 polyA=3 (S?Q ID NO:21) >Hs.69360_mRNA_2 gi j 14250609 j gb|BC00876 . l)BC008764 Homo sapiens clone MGC:1266 IMAGE :3347571 polyA=3 (SEQ ID NO:22) >Hs.30827_C?ntigl H07885 |N39347 ¡VJ85913 ) AA583408 | W86449 polyA=2 polyA=3 •(SEQ ID NO: 23) >Hs .211593_contig2 BF592799|AI570478|AA234440|R40214|BE501078|AW593784]AI184050|AI284161|W721 49]AW78043 J I24798l|AW241273 ¡H60824 polyA=2 polyA=3 (SEQ ID NO:24) >Hs..l55097_mRNA_l gi j 15080385 |gb|BC011949.1 |BC011949 Homo sapiens clone ' MGC:9006 IMAGE :3863603.polyA=3 (SEQ ID NO:25) >Hs..5163_mRNA_l gi 115990433 |gb|*BC015582.1 |BC015582 Ho o sapiens clone MGC:23280' IMAGE:4637504 polyA=3 (SEQ ID N0-.26) >Hs.5515Ó_mRNA_l gi |l7068414 jgb|BC017586.1 |BC017586 Homo sapiens clone MGC:26610 IMAGE:4837506 polyA=3 (SEQ ID NO:27) >Hs ..170177_sontig3 AI620495|AW291989|AA780896.|AA976262|AI298326|BF111862¡A 591523|AI922518[AI 48O28?|BF589437|AA6003S4]AI886238|AA035599|H90049fBF11201l)N5260l|AI570965 | I565367 | W768847 |H90073 |BE504361 ¡N45292 | I632075 ¡AA679729 |AW168052 ¡AI978 827 ¡AI968410 | I669255 ¡N45300 |AI651256 |AI698970 | I521256 |AW07861 | I802070 | AI885947 |AI342534 | ?653624 ¡AW243936 ¡T16586 |R15989 ]AI289789 |AI871636 |AI7187 85JA 148847 polyA=2 polyA=3 (SEQ ID NO:28) >Hs.l84601_mRNA__5 gi | 4426639|gb|AF104032.1j F104032 Homo-sapiens polyA=2 (SEQ ID NO:29) >Hs.351972__singletl AA865917 polyA=2 polyA=3 (SEQ ID NO:30) >Hs.5366_m8NA_2 gi | 15277845 ¡g |BC012926.1 |BC012926 Homo sapiens clone MGC:16817 IMAG?:3853503 polyA=3 (SEQ ID NO: 31) >Hs .18140_contigl AI68593l|AA410954|T97707|AA706873|AI911572|A 614616|AA548520JA*W027764|BF51 125l|AI914294|AW151688 p?lyA=l polyA=l (SEQ ID N0:32) >Hs .133l96__sontig2 BF224381|BE467992¡A 137689|AI695045|AW207361|BF445141|AA405473 polyA=2 ARN polyA=3 (SEQ ID NO:33) >Hs.63325_mRNA_5 gi ¡ 15451939 jref ¡NM_019894 -l| Homo sapiens transmembrane protease, serine 4 (TMPRSS4) , mRNA polyA=3 (SEQ ID NO: 34) >Hs. 50692 mRNA_2 gi 1184223 ¡ gb|M95585.1 |HUMHLF Human hepatic leukemia factor (HDP) mRNA, complete cds polyA=3 (SEQ ID NO':35) >Hs.250726_singlet4 A298545 polyA=2 polyA=3 (S?Q ID NO:36) >Hs.79 17_mRNA_2 gi | 16306657 |gb|BC00150 .1JBC001504 Homo sapiens clone MGC-.2273 IMAGE:3505512 polyA=3. (SEQ ID NO:37) >Hs.47986_mRNA_l gi | 13279253 ¡gb|BC004331.1JBC004331 Homo sapiens clone MGC:10940 IMAGE:3630835 polyA=3 (SEQ ID NO:38) >Hs.94367_mRNA_l gi 110440200 | dbj |AK027147.1 ¡AK027147 Homo sapiens cDNA: FLJ23494 fis, clone NG01885 polyA=3 (SEQ ID NO: 39) >Hs.49215_c ntigl '. " ' BI493248 ¡N66529 |AA452255 )BI492877 | W1966B3 | I963900 JBF478125 | I42165 |BE46 6675 polyA=-l polyA=l (S?Q ID N0:40) ->Hs .281587_contig2 R61469|R15891|AÁ007214|R61471JAI014624|N69765|AW592075|H09780|AA709038)AI3 35898 | I559229 | F09750 |R4959 |H11055 | T72573 ) A935S58 |AA988654 |AA826438 | I00 243l|AI299721 polyA=l polyA=2 (SEQ ID NO: 1) >Hs.79378_tnRNA_l gi | 16306528 |ref |NM_003914.2 ¡ Homo sapiens cyclin Al (CCNA1) , mRNA polyA=3 (SEQ ID NO: 2) >Hs.l56469__contÍg2 AI341378 | I6708Í7 | I701687 jAI3ln set 22|AV?235883lAI948598|AA446356 polyA=2 polyA=3 "(SEQ ID NO: 3) >Hs.6631__mRNA_l gi | 7020430 | bj |AK000380.1 |AK00038O Homo sapiens sDNÁ F J20373 fis, clone HEP19740 polyA=3 (S?Q ID NO:44) >Hs.l55977__contigl AI309080 | AI313045 polyA=l WARN polyA=l (S?Q ID NO:45) >Hs.95197_mRNA_4 gi | 5817138 j emb |AI>110274 ,1 |HSM800829 Homo sapiens mRNA; cDNA D FZp564I0272 (from clone D FZp564I0272) polyA=3 (S?Q ID NO: 6) >Hs.48956_contigl N64339 | I569513 ¡AI694073 polyA=l polyA=l (S?Q ID NO:47) >Hs.ll8825_mRNA_10 gi ) 1495484 | emb ¡X96757. l|HSSAPKK3 H. sapiens mRNA for MAP kinase kinase polyA=3 (SEQ ID NO: 8) >Hs .135118_contig3 AI68318l|AI082848 [A 770198 |AI333188 ¡AI873435 | W169942 |AI806302 | W340718 |BF 196955 JAA909720 polyA=l polyA=2 (SEQ ID NO:49) >Hs.171857 mRNA_l gi 113161080 ] gb|AF33222 .1 |AF332224 Homo sapiens testis protein mRNA, partial cds polyA=3 (SEQ ID NO.-50) >Hs.l8910_mRNA_3 gi | 12804464 | gb|BC001639.1 |BC001639 Homo sapiens clone MGC.-1944 IMAGE -.2959372 polyA=3 (SEQ ID NO: 51) >Hs.l94774 nRNA_l gi | 16306633 |gblBC001492.1 ¡BC001492 Homo sapiens clone MGC:1774 IMAGE:3510004 polyA=3 (SEQ ID N0:52) >Hs.l27426 t?RNA_2 gi | 16306818 | b|BC006537.1 |BC00"6537 Homo sapiens clone MGC.-1934 IMAGE: 2987903 polyA=3 (SEQ ID NO: 53) >Hs .126852_contigl AI802118|BF197404|BF224434|AA931964|A 236083|AI253119|A 614335|AI671372|AI 793240|A 006851|AI953604)AI640505¡AI633982|AW195809|AI493069¡AW058576|AW29 3622 polyA_-2 polyA=3 (SEQ ID N0:54) >Hs.28149_mRNA_l gi | 14714936 jgb¡BC010626.1 ¡BC010626 Homo sapiens clone MGC:17687 IMAGE:3865868 polyA=3 (SEQ ID N0:55) >Hs.35453_mRNA_3 gi | 7018494 |'emb ¡A 157475.1 ¡HSM802461 Homo sapiens raRNA; sDNA DKFZp761G151 (from clone DKFZp761G151) ,- partial cds polyA=3 (SEQ ID NO:56) I >Hs.l80570_contÍgl R08175 |AA707224 | A699986 JR11209 | 89099 |T98002 |AA494546 polyA=2 polyA=3 (SEQ ID NO* 57) -»Hs.l96270__mRNA_l gi ¡ 11545416 ¡gb]AF283645.1 |AF283645 Homo sapiens chromosome 8 map 8q21 polyA=3 (SEQ ID NO:58) -.Hs. 030_mRNA_3 gi | 12652600 )gb|BC000045.1 |BC000045 Homo sapiens clone > MGC-.2032 IMAGE:3504527 polyA=3 (SEQ ID NO:59) >Hs.l282_mRNA_3 gi | 559405 | ref ¡MM_000065.1 | Homo sapiens .complement component 6 (C6) , mRNA polyA=l (SEQ ID NO: 60) >Hs.268562__mRNA_2 gi 115341874 |gbJBC013117.1 ¡BC013117 Homo sapiens clone MGC:8711 IMAGE: 3882749 polyA=3 (SEQ ID NO: 61) I >Hs.l51301_mRNA_3 gi | 16041747 |gb)BC015754.l|BC015754 Homo sapiens clone MGC:23085 IMAGE :4862492 polyA=3 (SEQ ID NO:62) >Hs . lll_contigl AA946776|A 242338|H24274|AI078616 (SEQ ID NO : 63) >Hs.l50753__contÍgl AI123582 | I288234 polyA=0 polyA=0 (SEQ ID NO: 64) ! >Hs.82109_mRNA_l gi ¡ 14250611 |gb ¡BC008765.1 ¡BC008765 Homo sapiens clone MGC:1622 IMAGB :3347793 polyA=3 (SEQ ID NO:65) >Hs.44276_mRNA_2 gi | 12654896 ¡gb |BC001293.1 |BC001293 Homo sapiens clone MGC:5259 IMAGE: 3458115 polyA=3 (SEQ ID NO: 66) >HS. 1 2_T?RNA_4 gi j 1332527 |gb|BC004453.1 ¡BC004453 Homo sapiens clone > MGC:4303 IMAGE : 2819400 polyA=3 (SEQ ID NO:67) >He.180908_contÍgl AA846824.J-AW611680 |AA8:46182 |AA846342 |AA846360 polyA=2 polyA=3 (SEQ ID NO: 68) >Hs.89436_mRNA_l gi ¡ 16507959 ¡ref ¡NM_004063.2 | Homo sapiens cadherin 17, Ll cadherin (liver-intestine) (CDH17) , mRNA polyA=l (SEQ ID NO: 69) >Hs.l51544_mRNA_8 gi | 3153107 | emb| L023657.1 ¡HSDSHP Homo sapiens SH2D1A . cDNA. formerly known as DSHP polyA=3 (SEQ ID NO: 70) >Hs .1657_contig4 AW473119-|AA164586 | AI540656 ¡AI758480 |AI8109411AI978964 |AI675862 ¡AI784397 ¡A 591562 ¡ W51410 | I888116 |AI983175 | AI634735 | I669577 ¡AI202659 ¡AI910598 ¡AI96 1352 |AI565481 ¡ I88625 |AI538838 ¡AA291749 |A 571455 ¡AI370308 |AI274727 ) 4739 25¡A 514787¡AI27387l)AW470552¡AI524356]AI88828l|AW089672|AI952766|A 440601 . ]AI654044|AW438839|AI972926 polyA=2 polyA=3 (SEQ ID NO: 71) >Hs.35984_mRNA_l gi | 049161 ¡gb ¡AF133587.1 ¡AF133587 Homo sapiens chromosome 22 map 22qll.2 polyA=3 (SEQ ID NO: 72) >Hs.334534_mRNA_2 gi | 17389403 |gb|BC017742.1 ¡BC017742 Homo sapiens, clone IMAGE: 391536, RNA polyA=3 (SEQ ID NO: 73) >Hs.60162_mRNA_l gi ¡ 1043764 | bj ¡AK025181.1JAK025181 Homo sapiens cDNA: FLJ21528 fis, Clone COL0S977 polyA=3 (SEQ ID NO: 74) Como será entendido por la persona experta, la detección de la expresión de cualquiera de las secuencias identificadas en lo anterior, así como secuencias del conjunto de 90 enseguida, o las secuencias proporcionadas en el listado de secuencias adjunto se pueden realizar mediante la detección de la expresión de cualquier porción p fragmento apropiado de estas secuencias. De preferencia, las porciones son suficientemente grandes para contener secuencias únicas relativas a otras secuencias expresadas en una muestra que contiene células. Además, las persona experta reconocería que las secuencias- divulgadas representan una hebra de una molécula de doble hebra y que cualquier hebra puede ser detectada como un. indicador de la expresión de las secuencias divulgadas. Esto continua debido a que las secuencias divulgadas se expresan como moléculas de RNA en células que de preferencia se convierten a moléculas de cDNA para facilidad de manipulación y detección. Las moléculas de cDNA resultantes pueden tener las secuencias del RNA expresado así como aquellas de la hebra complementaria a las mismas. Así, puede ser detectada ya sea la hebra de la secuencia de RNA o la hebra complementaria. Por supuesto, también es posible detectar el RNA expresado sin conversión a cDNA. En algunas modalidades de la invención, los niveles de expresión de las secuencias de gen se miden mediante la detección de las secuencias expresadas en una muestra que contiene células como que híbrida los siguientes oligonucleótidos, que corresponde a las secuencias anteriores como es indicado por los números de acceso proporcionados . . >AP133587 CCCGGATCGCC?TCAGTGTCATCGAGTTCAAACCCTGAGCCCTTCATTCACCTCTGTGAG (SEQ. ID NO: 75) >BC017742 TGCCCTTGCTCTGTGTCATCTCAGTCATTTGACTTAGAAAGTGCCCTTCAAAAGGACCCT (SEQ ID NO -.76) >BF437393 GGAGGGAGGGCTAATTATATATTTTGTTGTTCCTCTATACTTTGTTCTGTTGTCTGCGCC (SEQ ID NO: 77) >AI620495 CAGTTTGGATTGTATAATAACGGCAAGCCCAGTTGTAGTCGTTTGAGTGCAGTAATGAAA (SEQ ID NO: 78) AAATCAGAsTAACCC TTCTGTATTGAGTGCAGTGTTTTTTACTCTTTTCTCATGCACAT (SEQ ID NO: 9)' >BC009237 TGCCTGGCACAAAGAAGGAAGAATATAAATGATAGTTCGACTCGTCTGTGGAAGAACTTA (SEQ ID NO:80) >BC008765 AGTCTTTTGCTTTTGGCAAAACTCTACTTAATCCAATGGGTTTTTCCCTGTACAGTAGAT (S?Q ID NO: 81) >BC001504 GGTTACTGTGGGTGGAATAGTGGAGGCCTTCAACTGATTAGACAAGGCCCGCCCACATCT (SEQ ID NO:82) >KM_019894 TAAAATGCACTGCCCTACTGTTGGTATGACTACCGTTACCTACTGTTGTCATTGT ATTA (SEQ ID NO:83) >BF224381 TTCTCTTTTOGGGGCAAACACTATGTCCTTTTCTTTTTCTAGATACAGTTAATTCCTGGA (SEQ ID NO: 84) >AL157475 AAGACCCACACCCTGTAGCAATACCAAGTGCTATTACATAATCAATGGACGATTTATACT (SEQ ID NO: 85) >AY033998 ?GTGTTGCAAGTTTCCTTTAAAACCAACAAAGCCCACAAGTCCTGAATTTCCC?TTCTTA- (SEQ ID NO : 86) >H07885 GTCACTGTCATAGCAGCTGTGATTTCACAAGGAAGGGTGCTGCAGGGGGACCTGGTTGAT ( SEQ ID NO : 87) >NM_004496 TTTCATCCAGTGTTATGCACTTTCCACAGTTGGTC3TTAGTATAGCCAGAGGGTTTCATTA (SEQ ID NO : 88 ) >AA846824 GGGAAGTAGGGATTATTCGTTTAAATTCAATCGCGAGCACCAAGTCGGACTGGCCGGGGA (SEQ ID NO: 89) >BC017586 GGGACCAGGCCCTGGGACAGCCATGTGGCTCCAAATGACTAAATGTCAGCTCAAAAACCA (SEQ ID 110:90) >AA456140 TCCGTTTATGGAGGCAATTCCATATCCTTTCTTGAACGCACATTCAGCTTACCCCAGAGA (SEQ ID NO: 91) >NM_002283 AGAGTTAAGCCACTTCCTGGGTCTCCT CTTATGACTGTCTATGGGTGCATTGCCTTCTG (SEQ ID NO : 92) >AI_023657 GTGGCCTGAGTAATGCATTATGGGTGGTTTACCATTTCTTGAGGTAAAAGCATCACATGA- (SEQ ID NO : 9 ) . >BC001639 ACACATGCATGTGTCTGTGTATGTGTGAATGTGAGAGAGACACAGCCCTCCTTTCAGAAG (SEQ ID NO : 94 ) >BC015754 TCTGTAACTGCACAACCCTGGGGTTTGCTGCAGAGCTATTTCTTTCCATGTAAAGTAGTG (SEQ ID NO: 95) >AF332224 AAACACTCTTTCCGACTCCAGAGGAGAAGCTGGCAGCTCTCTGTAAGAAATATGCTGATC (SEQ ID NO: 96) >BC001270 GCTTCCTCTATCGCCCAATGCA5AATCGATGAAATGGGGAGTTCTCTGGGCCAGGCCACA (SEQ ID NO: 97) - >AI147926, GTAGAATCCTCTGTTCATAATGAACAAGATGAACCAATGTGGATTAGAAAGAAGTCCGAG (SEQ ID NO: 98) >A 298S45 CTGTTTTAAAACTGAATGGCACGAAATTGTTTTCCTCAACTCGGAGATTCCTGTATGGAG (SEQ ID NO: 99) ' - - - - - - >AI802118 AATAAAtAGTAGCTCTGCTGATGATGACGTTGATAACCAAACTGTTCTGTGGTCTTi-AGT (SEQ ID NO: 100) >AI683181 CAAACAGCCCGGTCTTGATGCAGGAGAGTCTGGAAAAGGAAGAAAATGGTTTCAGTTTCA (S?Q ID NO: 101) >M95585 AACATGGACCATCCAAATTTATGGCCGTATCAAATGGTAGCTGAAAAAACTATATTTGAG (SEQ ID NO: 102) >AK027147 TTGTAATCATGCCAATTCCAGATCAAtAACTGCATGTCTGT'rCTTTGGrAGAAATAGCT'r (SEQ ID NO: 103) >A 291189 AAAGATTATTAACCCAAATCACCTTTCTTGCTTACTCCAGATGCCTCAGCCTCTGATATA (SEQ ID NO: 104) >AI632869 GACTTCCTTTAGGATCGCAGGCTTCTGCAGTTCTCATGACTCCTACTTTTCATCCTAGTC (SEQ ID.
NO: 105) >BC006537 CTGTATATTTTGCAATAGTTACCTCAAGGCCTACTGACCAAATTGTTGTGTTGAGATGAT (SEQ ID NO: 106) >R61469 TGGTCAAACAGACTTTAACCTCTGCATCATACTTAACCCTGCGACATGCGTACAGTATGC (SEQ ID ' NO: 107) >BC009084 TGAGTCATATACATTTACTGACCACTGTTGCTTGTTGCTCACTGTGCTGCTTTTCCATGA (SEQ ID NO:108) >N64339 CTGAAATGTGGATGTGATTGCCTCAATAAAGCTCGTCCCCATTGCTTAAGCCTTCAAAAA (SEQ ID NO: 109) >AI200660 ATCAAGAAAACCtAATCTTCTGACTCCCAGGCCAGGATGTTTTATTTCTCACATCATGTC . (SEQ ID NO: 110) >AK054605 TTCA TCCAAACATCATCTTTAAGACTCCAAGGATTTTTCCAGGCACAGTGGCTCATAC (SEQ ID NO: 111) >NM_006115 AGTTAGAAATAGAATCTGAATTTCTAAAGGGAGATTCTGGCTTGGGAAGTACATGTAGGA (SEQ ID NO: 112) >X96757 CAATTTTCTTTTTACTCCCCCTCTTA GGGGGCCTTGGAATCTATAGTATAGAATG?ACT (SEQ ID NO : 113 ) ' >AI804745 GGGTGGAGTTTCAGTGAGAATAAACGTGTCTGCCTTTGTGTGTGTGTATATATACAGAGA (SEQ ID NO: 114) >AJ000388 CTCGCTCATTTTTTACCATGTTTTCCAGTCTGTTTAACTTCTGCAGTGCCTTCACTACAC (SEQ ID NO: 115) >BC008754 CTlTGGGCCGAGGaCTGAATGTCTTGTACTTTAAAAAAATGTTTCTGAGACCTCTTTCTA (SEQ ID NO : 116) >AI309080 CTGGACCCTTGGAGCAGTGTTGTGTGAACTTGCCTAGAACTCTGCCTTCTCCGTTGTCAA (SEQ ID NO .-117) >AA865917 CCACCTCCTTCGACCTCCACTGCGCCCCACCTCCCTGCCTGTGTGrGTTATTTCAAAGGA (SEQ ID NO: 118) >AA946776 TCTGGCTGGTGGCCTGCGCGAGGGTGGAGTCT ACTTAAAAGACTT*TCAGTTAATTCTCA (SEQ ID NO:119) >AF104032 AGATGCTGTCGGCAGCA GTTTATTTATTTCCAGTGGTCATGCTGAGCCTTGCTGCTCTG (SEQ ID NO.-120) >A 194680 TCCTTCCTCTTCGGTGAATGCAGGTTATTTAAACTTTGGGAAATGTACT TTAGTCTGTC {SEQ ID NO: 121) >BC001293 GTCCTGTCCCTGTCTGGGAGTTGTGTTATTTAAAGATATTCTGTATGTTGtATCTTTTGC (SEQ ID NO: 122) >BE962007 ATTATATTTCAGGTGTCCTG-^ACAGGTCACTAGACTCTACATTGGGCAGCCTTTAAATAT {SEQ ID NO: 123) >BI493248 AGGAATGGTACTACCGTTCCAGATTTTCTGTAATTGCtiCTGCAAAGTAATAGGCTTCTT. (SEQ ID NO: 124) >AF283645 CTGTACCCAAAGGATGCCAGAATACTAGTAT?TTTATTTATCGTAAACATCCACGAGTGC (SEQ ID NO: 125) >AI669760 ATTGCCCCCCTAACCAATCATGCAAACTTTTCCCCCCCTGGGGTAATTCACCAGTTAAAA (SEQ ID NO: 126) >BC001492 CCCACAGTATTTAATGCCCTGTCAGTCCCTTCTAGTCTGACTCAATGGTAACTTGCTGTA (S?Q ID NO: 127)) >BC004453 AAAACCAACTCTCTACTACACAGGCCTGATAACTCTGTACGAGGCTTCTCTAACCCCTAG (S?Q ID NO: 128) >BC010626 CTCAGACTGGGCTCCACACTCTTGGGCTTCAGTCTGCCCATCTGCTGAATGGAGACAGCA (S?Q ID NO -.129) >BC013117 CCTAATGGGGATTCCTCTGGTTGTTCACTGCCAAAACTGTGGCATTTTCATTACAGGAGA (SEQ ID NO: 130) >BC011949 CACTCACAATTGTTGACTAAAATGCTGCCTTTAAAACATAsGAAAGTAGAATGGTTGAGT (SEQ ID NO: 131) >AW083022 CTTTGAAGGGCTGCTGCACATTGTTGAATCCATCGACCTTTAGCTGCAATGGGATCTCTA (SEQ ID NO: 132) >R08175 TGCCTCATCGATATTATAGGGGTCCATCACAACCCAACTGTGTGGCCGGATCCTGAGTCT (SEQ ID NO: 133) >NM_00006S AAAACAGACAAAAGCCTTTGCCTTCATGAAGCATACATTCATTCAGGGGTAGACACACAA (SEQ ID NO: 134) >AK025181 TAACAAACAAAGGCAGTAGCTCATCACTTGGGTAGCAGGTACCCATTTTAGGACCCTACA (SEQ ID NO: 135) >NM_003914 ATATCAGAAGTGCCAATAATCGTGATAGGCTTCTGCACGTTGGATCAAC-t?ATGTTGTTT (SEQ ID NO:136) >AI123582 TCATAGCCCAACCATGTGAGAAGA?GGAGAAGGCCCCCCTTTCTTCATTAATCTGAAAA (SEQ ID NO:137) . .. >BC004331 GCAGACCATTCTATCATACCTGGCAGGGCTTC GTTTTATTTTGTAGGCTGGATGeTAG.C <SEQ ID NO: 138) >AI341378 ACTACAAGCCTCTTGTTTTTCACGAAAAsCCTACATCTCAGGCTTACTAATTTTTGTGAT (SEQ ID NO:139)"' >NM_004063 GCCATGCATACATGCTGCGCATGTTTTCTTCATTCGTATGTTAGTAAAGTTTTGGTTATT {SEQ ID NO: 140) >BC012926 CACCTATTTATTTTACCTCTTTCCCAAACCTGGAGCATTTATGCCTAGGCTTGTCAAGAA (SEQ ID NO: 141) >AL110274 GTGGACATAGCCACTAACCAACTAGTTACCTTTGGACTGCAACAAAAAATGTGAAAATGA (SEQ ID NO: 142) >AW473119 ACTTGTAAACCTCTTTTGCACTTTGAAAAAGAATCCAGCGGGATGCTCGAGCACCTGTAA (SEQ ID NO : 143 ) >AI685931 AATTCTCTATAAACGGTTCACCAGCAAACCACCAATACATTCCATTGTTTGCCTAGAGAG (SEQ ID NO: 144) >BF592799 AATGGCCCATGCATGCTGTTTGCAGCAGTCAATTGAGTTGAATTAGAATTCGAACCATAC (SEQ ID NO: 145) >BC000045 GAGCTCAGTACTTGCCCTGTGAAAATCCCAGAAGCCCCCGCTGTCAATGTTCCCCATCCA (SEQ ID NO: 146) >BC015582 ATGAAGCGGAATTAGGCTCCCGAGCTAAGGGACTCGCCTAGGGTCTCACAGTGAGTAGGA (SEQ ID NO:147) >M60502 AGTGGCTATATCAACATCAGGGCTAGCACATCTTTCTCTATTATCCTTCTATTGGAATTC (SEQ ID NO: 148) La invención también proporciona un segundo grupo de 90 secuencias de gen de las cuales 50 o más pueden ser utilizadas en la práctica de la invención. Las 50 a 90 secuencias de gen se pueden utilizar junto con la determinación de los niveles de expresión de secuencias adicionales mientras que los niveles de expresión de las secuencias de gen del conjunto de 90 se utiliza en la clasificación. Un ejemplo no limitativo de tales modalidades de la invención es donde la expresión de las 90 secuencias de gen, o por lo menos 50 (o 50 a aproximadamente 90) miembros de las mismas, se mide junto con los niveles de expresión de una pluralidad de otras secuencias, tal como mediante el uso de una plataforma basada en microarreglo utilizada para realizar la invención. Donde esos otros niveles de expresión no se utilizan en la clasificación, .ellos se pueden considerar los resultados de la secuencias transcritas "en exceso" y no críticas para la práctica de la invención. Alternativamente, y donde esos otros niveles de expresión se utilizan en la clasificación, ellos están dentro del alcance de la invención, donde el uso de las secuencias descritas en lo anterior no necesariamente excluye el uso de los niveles de expresión de secuencias adicionales. 38 miembros del conjunto, de 90 se incluyen en el primer conjunto de 74 descrito en lo anterior. Los números de acceso de estos miembros en común entre los dos conjuntos son AA456140, AA846824, AA946776, AF332224, AI620495, AI632869 AI802118, AI804745, AJ000388, AK025181, AK027147, AL157475 A 194680, A 291189, AW298545, AW473119, BC000045, BC001293 BC001504, BC004453, BC006537, BC008765, BC009084, BC011949 BC012926, BC013117, BC015754, BE962007, BF224381, BF437393 BI493248, M60502, NMJD00065, NM_003914, N _004063, NM_0044.96 NM_006115 y R61469. Las secuencias de mRNA correspondientes a miembros del conjunto de 90 que no están presentes en el conjunto de 74 secuencias de gen también se proporcionan en el listado de secuencias y se identifican como SEQ ID NOS: 149-200. El listado de información de identificación para estos 52 miembros únicos por los números de acceso, así como las secuencias de oligonucleótido correspondientes que pueden ser utilizadas en la práctica de la invención, se proporciona or lo siguiente: >R15881- ACTTCTGGTGATGATAAAAATGGTTTTATCACCCAGATGTGAAAGAAGCTGCCTGTTTAG (SEQ ID NO:201) >AI041545 GTGGTTCTGTAAAAACGCAGAGGAAAAGAGCCAGAAGGTTTCTGTTTAATGCATCTTGCC (SEQ ID NO: 202) >NM_024423 TTTATAAGGAAGCAGCTGTCTAAAATGCAGTGGGGTTTGTTTTGCAATGT TAAACAGA (SEQ ID NO: 203) >AB038160 CTTATGAAGCTGGCCGGGCCACTCACGTTCAATGGTACATOTGGsTCTCTATGTGGTTCT (S?Q ID NO:204) >AK026790 GTGAGCCAGCATTTCCCATAGCTAACCCTATTCTCTTAGTCTTTCAAAATGTAGAATGGG (SEQ ID NO:205) >BC012727 CTTTACACCTGATAAAATATTTTGCGAAGAGAGGTGTTCTTTTTCCTTACTGGTGCTGAA (SEQ ID NO:206) - >BC016451 r GCATACATCTCATGCACAGGGGAAGATAAAGATGGTCACACaAAGAGTTTCCATAAAGAT (S?Q ID NO:207) >H09748 TGAGTTCAGCATGTGTCtGTCCATTTCATTTGTACGCTTGTTCAAAACCAAGTTTGTTCT (SEQ ID NO:208) >NM__006142 AAGACCGAGACTGAGGGAAAGCATGTCTGCTGGGTGTGACCATGTTTCCTCTCAATAAAG (SEQ ID NO-.209) >AF191770 GGCATCTGGCCCCTGGTAGCCAGCTCTCCAGAATTACTTGTAGGTAATTCCTCTCTTCAT (SEQ ID NO:210) >NM_006378 ' TGGATGTTTGTGCGCGTGTGTGGACAGTCTTATCTTCCAGCATGATAGGATTTGACCATT (S?Q ID NO : 211) >BC006.819 TCe-TGGCAGAGCCATGGTCCCAGGCTTCCCAAAAGTGTTTGTGGCAATTATTCCCCTAGG (SEQ ID NO: 212) >X79676 TTTGATGATAGCAGACATTGTTACAAGGACATGGTGAGTCTATTTTTAATGCACCAATCT (SEQ ID NO: 213) >BC006811 TTCTTCCAGTTGCACTATTCTGAGGGAAAATCTGACACCTAAGAAATTTACTGTGAAAAA . (SEQ ID NO: 214) >NM_000198 GAACAATTGTGGTCTCTCTTAACTGGAGGGTCTCTTTTGACTAATAGAGCTCCATTTCCC (SEQ ID NO : 215 ) >AF301598 GTT-^GTGTGGCC-^GCGCIACGGCGGCAAGTTTTCAAGCACTGAGTTTCTATTGCAAGAT (SEQ ID NO : 215) >NM_002847 CGGCCTACTGAGCGGACAGAATGATGCCAAAATATTGCTTATGTCTCTACATGGTATTGT (SEQ ID NO : 217) >NM_00 0 2 CAGGGTGTTTGCCCAATAATAAAGCCCCAGAGAACTGGGCTGGGCCCTATGGGAT GGTA (SEQ ID NO : 218) >AW118445 TGTACAGTTTGGTTGTTGCTGTAAATATGGTAGCGTTTTGTTGTTGTTGTTTTTTCATGC (SEQ ID NO: 219) >BC002551 TACCAAACTGGGACTCACAGCTTTATTGGGCTTTCTTTGTGTCTTGTGTGTTTCTTTTAT (SEQ ID NO:2-!0) >AA765597 CATTGAGGTTTGGATGGTGGCAGGTAAAACAGAAAGGCAAGATGTCATCTGACATTAGGC (SEQ ID NO: 221) >A__137761 AGTTCAGCACTGTGGTTATCATTGGTGATGCCAGAAAA.CATTAGTAGACTTAGACAATTG (SEQ- ID NO:222) >X78202 TAA?ATTTCTTGATTGTGACTATGTGGTCATATGCCCGTGTTTGTCACTTACAAAAATGT (SEQ ID 110:223) >AK025615 AGCCATCTGGTGTGAAGAACTCTATATTTGTATGTTGAGAGGGCATGGAATAATTGTATT (SEQ ID NO:224) >BC001665 CTTATTGTCACTGGTTAAGAACTTGGCGAGATTGAAGGGCTTTTGTGATTGTTGTTGGAT (SEQ ID NO:225) _ >AI985118 ' CTTTCTAGTGAGCTAACCGTAACAGAGAGCCTACAGGATACACGTGAGATAATGTCACGT (SEQ ID NO: 226) >AL039118 TTGTCTTAAAaTTTCTTGATTGTGATACTGTGGTCATATGCCCGTGTTTGTCACTTACAA (SEQ ID NO: 227) >AA782845 CCTGGGGGAAAGGGGCATTCATGACCTGAACTTTTTAGCAAATTATTATTCTCAGTTTCC (SEQ ID NO: 228) >BC016340 TTCATTñACAGTACTAAGTGGAAGGGATCTGCAGAXTCCAAATTGGAATAAGCTGTATCA (SEQ ID NO: 229) >A&745593 CC-AATGCAGAAGAGTATTAAGAAAGATGCTCAAGTCCCATGGCACAGAGCAAGGCGGGCA (SEQ ID NO: 230) >NM_004967 CAAGGCTACGATGGCTATGATGGTCAGAATTACTACCACCACCAGTGAAGCTCCAGCCTG (SEQ ID NO: 231) >BF510316 AGCTCACAGCTGGACAGGTGTTGTATATAGAGTGGAATCTCTTGGATGCAGCTTCAAGAA (SEQ ID NO:232) >AA993639 TCCAAAGTAGAAAGGGTTCTTTTAGAAAaCTTGAAGAaTGTGCCTCCTCTTAGCATCTGT (SEQ ID NO: 233) >AV656862 GATGCATTTTTCAGTCCCTTTTCAGAGCAAATGCTTTTGCAATGGTAGTAATGTTTAG?T (SEQ ID NO: 234) >X69699 CCTGTGGGGCTTCTCTCCTTGATGCTTCTTTCTTTTTTTAAAGACAACCTGCCATTACCA (SEQ ID NO: 235) >BC013282 TTGCACTAAGTCATGCTGTTTCCTC?AAGAAGCTTTGTTTTTTGTTAACGTATTACTCAG (SEQ ID NO:236) >AI457360 CTGGATCCCAGGCCCTGGCACCCCTCAGGAAATACAAGAAÍ-AAGAATATTCACATCTGTT (SEQ ID NO: 237) . >AW44?220 TTAGAGGGGCCACCTATCAACTCATCAGTGTTCAAAGAATATGCTGGGAGCATGGGTGAG (SEQ ID NO:238) >AP038191 GGCCCATTTAT TCCC CATGTCTCTAGAIGTTTCTCGTCACCCAGCCTCAA?AATATATG (SEQ ID NO:239) >X05615 TCCCCAAAAACCTCACCCGAGGCTGCCCACTATGGTCATCTTTTTCTCTAAAATAGTTAC (SEQ ID NO:240) >BC005364 GAAATTCCTCACACCTTGCACCTTCCCTACTTTTCTGAATTGCTATGACTACTCCTTGTT (SEQ ID NO: 241) >AK025701 TGTCTGTCCACCACGAGATGGGAGGAGGAGAAAAAGCGGTACGATGCCTTCCTGACCTCA (SEQ ID NO: 242) >BF446419 GTCTTATCTCTCAGGGGGGGTTTAAGTGCCGTTTGCAATAATGTCGTCTTATTTATTTAG (SEQ ID NO: 243) >AK025470 CCGAGTAGTATGGGTCTCTGTGTGAGAAACCAGGAGATATTTTCATCTTGTTCGGAAATA (SEQ ID NO: 244) >BE552004 TTGTGCAAAAGTCCCACAACCTTTCtGGATTGATAGTTTsTGGTGAAATAAACAATTTTA (SEQ ID NO: 245) >H05388 TCCAGTATTCTGCAGGGCCAGTCAGTTGTACAGAAGTTGGAATATTCTGTTCCAGAATTA (SEQ ID NO:246) >NM_033229 GTCTCGAACAGCGGTTGTTTTTACTTTATTTATCTTAGGCCCTCAGCTCCCTGACGTCCT (SEQ ID NO: 247) >BC010437 ?GTGAATCTTTTCCTCTTGGTAGCATGAACACTGGGGATAAATC?GAACCATTCTGTGGA (SEQ ID NO: 248) >AI952953 TGAGAGCCCAGAACAAGAAGGAGCAGAAGGGCACTTTGACCTTCATTATTATGAAAATCA (SEQ ID NO: 249) >R45389 GGAAGAACTGATGCTTGCTGCTAACTAAAGTTTTGGATGTATCGATTTAGAGAAGCAATT (SEQ ID NO:250) >NM_001337 GAATGAGAGAATAAGTCATGTTCCTTCAAGATCATGTACCCCAATTTACTTGCCATTACT (SEQ ID NO: 251) >AI499593 TACGGAAAGGAAACAGGTTATACTCTTAGATTTAAAAAGTGAAAGAAACTGCAGGCGCCT (SEQ ID NO.-252) En algunas modalidades de la invención, los niveles de expresión de las secuencias de gen se miden mediante la detección de ias secuencias expresadas en una muestra que contiene células . como que híbrida los oligonucleótídos anteriores, que corresponde a secuencias en el Listado de Secuencias como es indicado por los números de acceso proporcionados . En modalidades adicionales, la invención proporciona el uso de cualquier número de las secuencias de gen del conjunto de 74 o el conjunto de 90 en los métodos de la invención. Así cualquiera de 1 a todos de los 50 o más secuencias de gen utilizadas en la invención pueden ser de ya sea o ambos de los conjuntos anteriores. Así de uno, dos, res, cuatro, cinco, seis, siete, ocho, nueve, diez o más de las 50 o más secuencias pueden ser del conjunto de 74 o el conjunto de 90. Como se utiliza en la presente, una "muestra de tumor" o "muestra que contiene tumor" o "muestra que contiene células de tumor" o variaciones de los mismos, se refieren a muestras que contienen células de tejido o fluido aislado de un individuo que se sospecha de ser afligido con, o en riesgo de desarrollar, cáncer. Las muestras pueden contener células de tumor que pueden ser aisladas por métodos conocidos u otros métodos apropiados como se considera deseable por el profesional experto. Estos incluyen, pero no están limitados a, microdisección, microdisección de captura de láser (LCM) , o microdisección de láser (LMD) antes del uso en la presente invención. Alternativamente, las células no disectadas dentro de una "sección" de tejido pueden ser utilizadas. Ejemplos no limitativos de tales muestras incluyen aislados primarios (en contraste en las células cultivadas) que pueden ser recolectados por . cualquiera de ios medios no invasivos o mínimamente invasivos, incluyendo, pero no limitados a, lavado ductal, aspiración con aguja fija, biopsia de aguja, los dispositivos y métodos descritos en. la patente norteamericana 6,328,709, o cualquier otro medio adecuado reconocido en la técnica. Alternativamente, la muestra puede ser recolectada por un método invasivo, incluyendo, pero no limitado a, la biopsiá quirúrgica. La detección y la medición de secuencias transcritas se puede realizar por una variedad de medios conocidos en la técnica o como se considera apropiado por el profesional experto. Esencialmente, cualquier método de ensayo puede ser utilizado mientras que el ensayo refleje, cuantitativamente o cualitativamente, la expresión de la secuencia transcrita que es detectada. La habilidad para clasificar muestras de tumor se proporciona por el reconocimiento de la relevancia del nivel de expresión de las secuencias de gen (ya sea aleatoriamente seleccionada o especificada) y no por la forma del ensayo utilizado para determinar el nivel actual de expresión. Un ensayo de la invención puede utilizar cualquier característica de identificación de una secuencia de gen individual como es divulgado en la presente mientras que el ensayo refleje, cuantitativamente o cualitativamente, la expresión del gen en el "transcriptoma" (la fracción transcripta de genes en un genoma) o el "proteoma" (la fracción traducida de genes expresados en un genoma) . Los ensayos adicionales incluyen aquellos basados en la detección de los fragmentos ce polipéptido del miembro o miembros relevantes del proteoma. Ejemplos no. limitativos de este último incluyen la detección de fragmentos proteolíticos encontrados en un fluido biológico, tal como sangre o suero'. Las características de identificación incluyen, pero no están limitadas a, _ secuencias de ácido nucleico únicas utilizadas para codificar (DNA) , o expresar (RNA) , el gen o epítopes específicos a, o actividades de, una proteína codificada por una secuencia de gen. Los medios adicionales incluyen la detección de la amplificación • de ácido nucleico cerno indicativa de los niveles de expresión incrementados y la inactivación de ácido nucleico, supresión o metilación, como es indicativo de los niveles de expresión disminuidos. Establecida diferentemente, la invención puede ser practicada al analizar uno o más aspectos de la(s) plantilla (s) de DNA que implica la expresión de cada secuencia de gen, del RNA utilizado como un intermediario para expresar ia secuencia, o del producto proteináceo expresado por la secuencia, así como fragmentos proteolíticos de tales productos. Como tal, la detección de la presencia de, cantidad de, estabilidad de, o degradación (incluyendo proporción) de, tal DNA, RNA y moléculas proteináceas se puede utilizar en la práctica de la invención. En algunas modalidades, toda o parte de una secuencia de gen' se puede amplificar y detectar por métodos tal como la reacción en cadena de polimerasa (PCR) y variaciones de ia misma, tales como, pero no limitadas a, PCR cuantitativa (Q-PCR) , PCR de transcripción inversa (RT-PCR) , y PCR en tiempo real (incluyendo como un medio para medir las cantidades iniciales de copias de mRNA para cada secuencia en una muestra) , opcionalmente RT-PCR en tiempo real o Q-PCR en tiempo real. Tales métodos utilizarían uno o dos cebadores que son complementarios a las porciones de una secuencia de gen, donde los cebadores se utilizan para cebar la síntesis de ácido nucleico. Los ácidos nucleicos recientemente sintetizados son opcionalmente marcados y pueden ser detectados directamente o mediante hibridación a un polinucleótido de la invención. Los ácidos nucleicos recientemente sintetizados se pueden poner en contacto con polinucleótidos (que contienen secuencias de gen) de la invención bajo condiciones que permiten su hibridación. Los métodos adicionales para detectar la expresión de los ácidos nucleicos expresados incluyen los ensayos de protección de RNAsa, incluyendo las hibridaciones en fase líquida y la hibridación in situ de células,.
Alternativamente, la expresión de las secuencias de gen en las muestras FEPP se puede detectar como es divulgado en las solicitudes norteamericanas 60/504,087, presentada el 19 de septiembre de 2003, 10/727,100, presentada el 2 de diciembre de 2003, y 10/773,761, presentada el 6 de febrero de 2004 (todas las tres de las cuales son incorporadas en la presente por referencia como sí se expusieran completamente) . Brevemente, la expresión de toda o parte de una secuencia de gen expresada o transcripto se puede detectar mediante el uso de la detección mediada por hibridación (tal como, pero no limitada a, tecnología basada en raicroarreglo, cuentas o partículas) o la detección mediada por la PCR cuantitativa (tal como, pero no limitada a, la PCR en tiempo real y la PCR de transcriptasa inversa) como ejemplos no limitativos. La expresión de todo o parte de un polipéptido expresado puede ser detectado mediante el uso de técnicas de inmunohistoquímica u otra detección mediada por anticuerpo (tal como, pero no limitada a, uso de anticuerpos marcados que enlazan específicamente a por lo menos parte del polipéptido con relación a otros polipéptidos) como ejemplos no limitativos. Medios adicionales para el análisis de la expresión de gen estás disponibles, incluyendo la detección de la expresión dentro de un ensayo para la expresión de gen global o casi global en una muestra (por ejemplo, como parte de un análisis de perfilamiento de expresión de gen tal como en un microarreglo) . Ejemplos no limitativos son la amplificación de RNA lineal y aquellos descritos en la solicitud de patente norteamericana 10/062,857 (presentada el 25 de octubre de 2001) , así co o las solicitudes de patentes provisionales norteamericanas 60/298,847 (presentada el 15 de junio del 2001) y 60/257,801 (presentada el 22 de diciembre del 2000), todas las cuales son incorporadas en la presente por referencia en sus totalidades como sí se expusieran completamente . En modalidades que utilizan un ensayo basado en ácido nucleico para determinar la expresión incluye la inmovilización de una o más secuencias de gen sobre un soporte sólido, incluyendo, pero no limitados a, un sustrato sólido como un arreglo o a cuentas o la tecnología basada en cuentas como es conocido en la técnica. Alternativamente, los ensayos de expresión basados en solución conocidos en la técnica también pueden ser utilizados. La(s) secuencia (s) de gen inmovilizada (s) puede estar en la forma de polinucleótidos que son únicos o de otra manera específicos al (los) ge (es) tal que los polinucleótidos serían capaces de hibrídar al DNA o RNA del (los) gen (es). Estos polinucleótidos pueden ser de la longitud completa del (los) gen (es) o ser secuencias cortas de los genes (hasta un nucleótido más corto que la secuencia de longitud completa conocida en la técnica mediante la supresión del extremo 5' o 3' de la secuencia) que son de manera opcional mínimamente interrumpidos (tal como mediante desigualaciones o pares de bases no complementarias insertadas) tal que la hibridación con un DNA o RNA correspondiente a los genes no es afectada. En algunas modalidades, los polinucleótidos utilizados son del extremo 3' del gen, tal como dentro de aproximadamente 350, aproximadamente 300, aproximadamente 250, aproximadamente 200, aproximadamente 150, aproximadamente 100 o aproximadamente 50 nucleótidos de la señal de poliadenilación o sitio de poliadenilación be un gen o secuencia expresada. Los polinucleótidos que contienen mutaciones con relación a las secuencias de los genes divulgados también se pueden utilizar mientras que la presencia de las mutaciones todavía permita la hibridación para producir una señal detectable. Así la práctica de la invención es no afectada por la presencia de • desígualaciones menores entre las secuencias divulgadas y aquellas expresadas por -las células de una muestra del sujeto. Un ejemplo no limitativo de la existencia de tales desigualaciones se observan en caso de polimorfismo de secuencia entre individuos de una especie, tales como pacientes humanos individuales dentro de Homo sapiens . Como será apreciado por aquellos expertos en la técnica, algunas secuencias de gen incluyen estiramientos 3 ' poly A (o poly T en la hebra complementaria) que no contribuyen a la unicidad de las secuencias divulgadas. La invención así puede ser practicada con secuencias de gen que carecen de los estiramientos 3' poly A '(o poli T) . La unicidad de ia secuencias divulgadas se refiere a las porciones o entidades de las secuencias que se encuentran solamente en -los ácidos nucleicos, incluyendo secuencias únicas encontradas en la porción no traducida 3' de la misma. Algunas secuencias únicas para la táctica de la invención son aquellas que contribuyen a las secuencias consensúales para los genes tal que las secuencias únicas serán útiles en la detección de la expresión en una variedad de individuos antes que ser específicas para un polimorfismo presente en algunos individuos. Alternativamente, las secuencias únicas a un individuo o una subpoblación pueden ser utilizadas. Las secuencias únicas pueden ser las longitudes de polinucleótido de la invención como es descrito en la presente. En modalidades adicionales de la invención, los polinucleótidos que tienen secuencias presentes en las regiones no traducidas y/o de no codificación 3' de las secuencias de gen se utilizan para detectar niveles * de expresión en muestras que contienen células de la invención. Tales polinucleótidos opcionalmente pueden contener secuencias encontradas en las porciones 3' de las regiones de codificación de las secuencias de gen. Los polinucleótidos que contienen una combinación- de secuencias de las regiones de codificación y de no codificación 3' de preferencia tienen las secuencias arregladas contiguamente, sin secuencia (s) heteróloga (s) de intervención. Alternativamente, la invención puede ser practicada con polinucleótidos que tienen secuencias presentes en las regiones no traducidas y/o de no codificación 5' de las secuencias de gen para detectar el nivel de expresión en células y muestras de la invención. Tales polinucleótidos opcionalmente pueden contener secuencias encontradas en las porciones 5' de las regiones de codificación. Los polinucleótidos que contienen una combinación de secuencias de las regiones de codificación y de no codificación 5' pueden tener las secuencias arregladas contiguamente, sin secuencia (s) heteróloga (s) de intervención. La invención también puede ser practicada a consecuencias presentes en las regiones de codificación de las secuencias de gen. Los polinucleótidos de algunas modalidades contienen secuencias de las regiones no traducidas y/o de no codificación 3' o 5' de por lo menos aproximadamente 16, por lo menos aproximadamente 18, por lo menos aproximadamente 20, por lo menos aproximadamente 22, por lo menos aproximadamente 24, por lo menos aproximadamente 26, por lo menos aproximadamente 28, por lo menos aproximadamente 30, por lo menos aproximadamente 32, por lo menos aproximadamente 34, por lo menos aproximadamente 36, por lo menos aproximadamente 38, por lo menos aproximadamente 40, por lo menos aproximadamente 42, por lo menos aproximadamente 44, o por lo menos aproximadamente 46 nucleótidos consecutivos. El término "aproximadamente" cerno se utiliza en la oración previa se refiere a un incremento o disminución de 1 del valor numérico establecido. Otras modalidades utilizan secuencias que contienen polinucleótidos de por lo menos o aproximadamente 50, por lo menos o aproximadamente 100, por lo menos o aproximadamente 150, por lo menos o aproximadamente 200, por lo menos o aproximadamente 250, por lo menos o aproximadamente 300, por lo menos o aproximadamente 350, o por lo menos o aproximadamente 400 nucleótidos consecutivos. El término "aproximadamente" como se utiliza en la oración precedente se refiere a un incremento o disminución de 10% a partir del valor numérico establecido. Las secuencias del extremo 3' o 5' de las regiones de codificación de gen como se encuentran en polinucleótidos de la invención son de las mismas longitudes como aquellas descritas en lo anterior, excepto que ellas aturalmente serían limitadas por la longitud de la región de codificación. El extremo 3' de la región de codificación puede incluir secuencias de hasta la mitad de 3' de la región de codificación. A la inversa, el' extremo 5 ' de la región de codificación puede incluir secuencias de hasta la mitad de 5' de la región de codificación. Por supuesto las secuencias descritas en lo anterior, las regiones de codificación y polinucleótidos que contienen porciones de las- mismas, se pueden utilizar en sus totalidades. En otra modalidad de la invención, los polinucleótidos que contienen supresiones de nucleótidos del extremo 5' y/o 3' de secuencias de gen pueden ser utilizados. Las supresiones son de preferencia de 1-5, 5-10, 10-15, 15-20, 20-25, 25-30, 30-35, 35-40, 40-45, 45-50, 50-60, 60-70, 70-80, 80-90, 90-100, 100-125, 125-150, 150-175, o 175-200 nucleótidos del extremo 5' y/o 3' , aunque el grado de las supresiones naturalmente sería limitado por la longitud de las secuencias y ia necesidad de ser capaz para utilizar los polinucleótidos para la detección de los niveles de expresión. Otros polinucleótidos de la invención del extremo 3' de las secuencias de gen incluyen aquellas de cebadores y sondas opcionales para la PCR cuantitativa. De preferencia, los cebadores y sondas son aquellas que amplifican una región menor que aproximadamente 750, menor que aproximadamente 700, menor que aproximadamente 650, menor que aproximadamente 600, menor que aproximadamente 550, menor que aproximadamente 500, menor que aproximadamente 450, menor que aproximadamente 400, menor que aproximadamente 350, menor que aproximadamente 300, menor que aproximadamente 250, menor que aproximadamente 200, menor que aproximadamente 150, menor que aproximadamente 100, o menor que aproximadamente 50 nucleótidos de la señal de poliadenilación o sitio de poliadenilación de un gen o secuencia expresada. El tamaño de un amplicón de PCR de la invención puede ser de cualquier tamaño, incluyendo por lo menos o aproximadamente 50, por lo menos o aproximadamente 100, por lo menos o aproximadamente 150, por lo menos o aproximadamente 200, por lo menos o aproximadamente 250, por lo menos o aproximadamente 300, por lo menos o aproximadamente 350, o por lo menos o aproximadamente 400 nucleótidos consecutivos, todos con la inclusión de la porción complementaria a los cebadores de PCR utilizados . Otros polinucleótidos para el uso en la práctica de la invención incluyen aquellos que tienen suficiente homología a la secuencia de gen para detectar su expresión mediante el uso de técnicas de hibridación. Tales polinucleótidos de preferencia tienen aproximadamente o 95%, aproximadamente o 96%, aproximadamente o 97%, aproximadamente o 98%, o aproximadamente o 99% de identidad con las secuencias de gen que son utilizadas. La identidad se determina utilizando el algoritmo de BLAST, como es descrito en lo anterior. Los otros polinucleótidos para el uso en la práctica de la invención también pueden ser descritos en la base de la habilidad para hibridar a polinucleótidos de la invención bajo condiciones severas de aproximadamente 30% v/v a aproximadamente 50% de formamida y de aproximadamente 0.01 M a aproximadamente 0.15 M de sal para la hibridación y de aproximadamente 0.01 M a aproximadamente 0.15 M de sal para las condiciones de lavado a aproximadamente 55 a aproximadamente 65 °C o más alto, o condiciones equivalentes a 5 las mismas. En- una modalidad adicional de la invención, una población de moléculas de ácido nucleico de una sola hebra que comprenden una o ambas hebras de una secuencia de gen humana se proporciona co o una sonda tal que por lo menos una -0 porción de la población puede ser hibridada a una o ambas hebras de una molécula de ácido nucleico cuantitativamente amplificada del RNA de una célula o muestra de la invención. La población puede ser solamente la hebra antisentido de una secuencia de gen humana tal que una hebra de sentido de una 5 molécula de, o amplificada de, una célula puede ser hibrídada a una porción de- la población. La población de preferencia comprende una cantidad suficientemente en exceso de una o ambas hebras de una secuencia de gen humana en comparación a la cantidad de moléculas de ácido nucleico expresadas (o 0 amplificadas) que contiene una secuencia de gen complementaria . La invención además proporciona un método para clasificar una muestra de tumor humana al detectar los niveles de expresión de 50 o" más secuencias transcritas en 5 una muestra que contiene células o ácido nucleico obtenida de un sujeto humano, y al clasificar la muestra como que contiene una célula de un tipo de tumor encontrado en humanos para la exclusión de uno o más de otros tipos de tumor humanos. En algunas modalidades, el método puede ser utilizado para clasificar una muestra como que es, o que tiene células de, uno de los 53 tipos de tumor listados en lo anterior para la exclusión de uno o más de los otros 52. En otras modalidades, el método se utiliza para clasificar una muestra como que es, o que tiene células de, uno de los 34 tipos de tumor listados en lo anterior para la exclusión de uno o más de los otros 33 tipos de tumor. En modalidades adicionales, el método se ' utiliza para clasificar una muestra como que es, o que tiene células de, uno de los 39 tipos de tumor listados en lo anterior para la exclusión de uno o más de los otros 38 tipos de tumor . La invención también" proporciona un método para clasificar muestras de tumor como que es de un subconjunto de los tipos de tumor posibles descritos en la presente al detectar los niveles de expresión de 50 o más secuencias transcritas en una muestra cíe tumor que contiene ácido nucleico obtenida de un sujeto humano, y al clasificar la muestra como que es de un número de tipos de tumor encontradas en humanos para la exclusión de uno o más de otros tipos de tumor humanos. En algunas modalidades de la invención, el número de otros tipos de tumor es de 1 a aproximadamente 3, más de preferencia de 1 a aproximadamente 5, de 1 a aproximadamente 7 o de. 1 a aproximadamente 9 o aproximadamente 10. En otras modalidades, el número de tipos de tumor son todos del mismo tejido u origen de órgano tal como aquellos listados en lo anterior. Este aspecto de la invención se relaciona a la discusión anterior de la Figura 8 y la especificidad de intercambio en favor de la confidencia incrementada, y puede ser ventajosamente aplicado a situaciones donde ia clasificación de una muestra como un solo tipo de tumor está a un nivel de precisión o desempeño que puede ser mejorada al clasificar la muestra como una de un subconjunto de tipos de tumor posibles. En modalidades adicionales, la invención puede ser practicada al analizar la expresión de gen de células individuales o poblaciones de células homogéneas que se han disectado, o de otra manera aislado o purificado de, células contaminantes de una muestra como se presenta en una biopsia simple. Una ventaja proporcionada por estas modalidades es que las células no de tumor, contaminante (tales como linfocitos infiltrantes u otras células de sistema inmune) se pueden remover para estar ausentes de afectar los genes identificados o el análisis subsecuente de los niveles de expresión de gen como es proporcionado en la presente. Tal contaminación está presente donde una biopsia se utiliza para generar perfiles de expresión de gen. En modalidades adicionales de la invención utilizando la Q-PCR o Q-PCR de transcriptasa inversa como la plataforma de ensayo, los niveles de expresión de las secuencias de gen de la invención se pueden comparar a niveles de expresión de genes de referencia en la misma muestra o una relación de niveles de expresión puede ser utilizada. Esto proporciona un medio para "normalizar" los datos de expresión para la comparación de datos en una pluralidad de tipos de tumor conocidos' y una muestra que contiene células que es analizada. Mientras que una variedad de genes de referencia pueden ser utilizados, la invención también puede ser practicada con el uso de 8 secuencias de gen de referencias particulares que se identificaron para el uso con el conjunto de 39 tipos de tumor. Además, la Q-PCR puede ser realizada por completo o en parte con el uso de un formato múltiplex. Las secuencias de mRNA correspondientes a las 8 secuencias de referencia se proporcionan en el listado de secuencias adjunto. Un listado de la SEQ ID NOs correspondientes, con la información de identificación correspondiente, incluyendo los números deacceso y otra información, se proporciona por lo siguiente. >Hs.77031_mRNA_l gi | 16741772 |gb |BC016680.1 |BC016680 Homo sapiens clone MGC: 21349 IMAGE :4338754 polyA=3 (SEQ ID NO: 253) >Hs.77541_RNA_l gi | 12804364 |gb|BC003043.1 |BC003043 Homo sapiens clone MGC:4370 IMAGE:2822973 polyA=3 (SEQ ID NO:254) >Hs.7001_mRNA_l gi | 6808256 |emb JAL137727.1 |HSM802274 Homo sapiens mRNA; cDNA D FZp434M0519 (from clone DKFZp434M0519) ; partial cds polyA=3 {SEQ ID NO:255) >Hs.302144_mRNA_l gi | 11493400 [ gb JAF130047.1 ¡AF130047 Homo sapiens clone FLB3020 polyA=0 (SEQ ID NO:256) >Hs.26510jmRNA_2 gi | 11345385 |gb |AF308803.1 (AF308803 Homo sapiens chromosome 15 map 15q26 polyA=3 (SEQ ID NO:257) >Hs.324709_mRNA_2 gi | 12655026 j gb ¡BC001361.1 |BC001361 Homo sapiens clone MGC:2474 IMAGE : 3050694 polyA=2 (SEQ ID NO:258) >Hs.65756_mRNA_3 gi | 3641494 | gb (AF03515 .1 |AF035154 Homo sapiens ch otnosome 16 map 16pl3.3 polyA=3 (S?Q ID NO:259) >Hs.l65743_mRNA_2 gi 113543889 |gb ¡BC006091.1 ¡BC006091 Homo sapiens clone MGC-.12673 IMAGE :3677524 polyA=3 (SEQ ID NO:260) La detección de la expresión de cualquiera de las secuencias de referencia anteriores puede ser por la misma o diferente metodología como para las otras secuencias de gen descritas en lo anterior . En algunas modalidades de ia invención, los niveles de expresión de las secuencias de gen se mide mediante la detección de secuencias expresadas en una muestra que contiene células como que híbrida los siguientes oligonucleótidos , que -corresponden a las secuencias anteriores como es indicado por los números de acceso proporcionados . >BC006091 TCATCTTCACCAAACCAGTCCGAGGGGTCGAAGCCAGACACGAGAGGAAGAGGGTCCTGG (SEQ ID NO : 261) >BC003043 CTCTGCTCCTGCTCCTGCCTGCATGTTCTCTCTGTTGTTGGAGCCTGGAGCCTTGCTCTC ( SEQ ID NO : 262 ) >AF130047 TGGTCCCGGCTGTCCTCCTCTCCTCTTCCCTAGTGAGTGGTTAATGAG GTTAATGCCTA (SEQ ID NO : 263) . >AF035154 CCCCATCTCTAAAÁCCAGTAAATCAGCCAGCGAATACCCGGAAGCAAGATGCACAGGCGG (SEQ ID N0:264) >BC001361 CCAGAAACAAGGAAG GGAAAGACAAAGGGAAGGGACGGGAGCCCTGGAGAAGCCCGACC (SEQ ID N0:265) >AF308803 AAGTACAACCCATGCTGCTAAGATGCGAGCAGGAAGAGGCATCCTTTGCTAAATCCTGTT (SEQ ID N0:266) >BC016680 ACCTCACCCCTGCCCGGCCCAAGCTCTACTTGTGTACAGTGTATATTGTATAATAGACAA (SEQ ID • NO: 267) >AL137727 TTCCCTTAATTCCTCCTCCCGACCTTTTTTACCCCCCCAGTTGCAGTATTTAACTGGGGT (SEQ ID NO:268) En un aspecto adicional, los métodos proporcionados por la presente invención también puede ser automatizados por completo o en parte. Esto incluye la modalidad de la invención en software. Ejemplos no limitativos incluyen instrucciones ejecutables por procesador en uno o más dispositivos de almacenamiento leíbles en computadora en donde las instrucciones dirigen la clasificacion.de muestras de tumor basado en los niveles de expresión de gen como es descrito en la presente. Las instrucciones ejecutables por procesador adicionales en uno o más dispositivos de almacenamiento leíbles en computadora son contemplados en donde las instrucciones causan la representación y/o manipulación, por la vía de un dispositivo de salida de computadora, del proceso o resultado de un método de clasificación. La invención incluye modalidades de software y de hardware en donde los datos de expresión de gen de un conjunto de secuencias de gen en una pluralidad de tipos de tumor conocido es englobado como un conjunto de datos. En algunas modalidades, el conjunto de datos de expresión de gen se utiliza para la práctica de un método de la invención. La invención también proporciona medios relacionados con computadora y sistemas para realizar los métodos divulgados en la presente. En algunas modalidades, se proporciona un aparato para clasificar una muestra que contiene células. Tal aparato puede comprender una entrada de consulta configurada para recibir un almacenamiento de consulta configurado para almacenar un conjunto de datos de expresión de gen, como es descrito en la presente, recibido de una entrada de consulta; y un módulo para accesar y utilizar datos del almacenamiento en un algoritmo de clasificación como es descrito en la presente. El aparato además puede comprender un almacenamiento de secuencia ordenada para los resultados del algoritmo de clasificación, opcionalmente con un módulo para accesar y utilizar datos del almacenamiento de secuencia ordenada en un algoritmo de salida como es descrito en la presente. Las etapas de un método, proceso o algoritmo descritos en conexión con ías modalidades divulgadas en ía presente se puede englobar directamente en el hardware, en un módulo de software ejecutado por un procesador, o en una combinación de los dos. Las varias etapas o actos en un método o proceso se pueden realizar en el orden mostrado, o se pueden realizar en otro orden. Adicionalmente, una o más etapas del proceso o método pueden ser omitidas o una o más etapas del proceso o método pueden ser adicionadas a los métodos y procesos. Una etapa, bloque o acción adicional se puede adicionar en los elementos existentes de comienzo, finalización o intervención de los métodos y procesos. Un aspecto adicional de la invención proporciona el uso de la presente invención en relación a actividades clínicas. En algunas modalidades, la determinación o medición de la expresión de gen como es descrito en la presente se realiza como .parte de la provisión del cuidado médico a un paciente, incluyendo la provisión de servicios de diagnóstico en soporte para proporcionar el cuidado médico. Así la invención incluye un método en el cuidado médico de un paciente, el método que comprende determinar o medir los niveles de expresión de secuencias de gen en una muestra que contiene células obtenida de un paciente como es descrito en la presente. El método además puede comprender la clasificación de la muestra, basado en la determinación/medición, como que incluye una célula de tumor de un tipo de tumor u origen de tejido de una manera como es descrito en- la presente. La determinación y/o clasificación puede ser para el uso en correlación con cualquier aspecto o modalidad de la invención como es descrito en la presente. La determinación o medición de los niveles de expresión puede ser precedida por una variedad de acciones relacionadas. En algunas modalidades, la medición es precedida por una determinación o diagnosis de un sujeto humano como en necesidad de tai tratamiento. La medición puede ser precedida por una determinación de una necesidad para la medición, tal como aquel por un doctor, médico, enfermera u otro proveedor o profesional del cuidado de la salud, o aquellos que trabajan bajo su instrucción, o personal de una aseguradora de la salud u organización de mantenimiento en aprobar el desempeño de una medición como una base para solicitar el reembolso o pago para el desempeño. La medición también puede ser precedida por actos preparatorios necesarios para la medición actual. Ejemplos no limitativos incluyen la obtención actual de una muestra que contiene células de un sujeto humano; o la excepción de una muestra que contiene células; o seccionamiento de una muestra que contiene células; o aislamiento de células de una muestra que contiene célula; u obtención de RNA de las células de una muestra que contiene células; o el RNA de transcripción inversa de células de una muestra que contiene células. La muestra puede ser cualquiera, como es descrito en la presente para la práctica de la invención.
En modalidades adicionales, la invención proporciona 'un método de ordenamiento, o recepción de una orden para, el desempeño de un método en el cuidado médico de un paciente u otro método de la invención. El ordenamiento puede ser hecho por un doctor médico, una enfermera u otro proveedor del cuidado de la salud, o aquellos que trabajan bajo su instrucción, mientras que la recepción, directamente o indirectamente, puede ser hecha por cualquier persona quien realiza el (los) método (s). El ordenamiento puede ser por cualquier medio de comunicación, incluyendo la comunicación que es escrita, oral, electrónica, digital, analógica, telefónica, en persona, por facsímil, por correo o de otra manera pasa a través de una jurisdicción dentro de los Estados Unidos. La invención además proporciona métodos en el procesamiento del reembolso o pago para una prueba, tal como el método anterior en el cuidado médico de un paciente u otro método de la invención. Un método en el procesamiento del reembolso o pago puede comprender la indicación de que 1) el pago sea recibido, o 2) el pago será hecho por otro pagador o 3) el pago permanece no pagado sobre papel o en una base de datos después del desempeño de un método de detección, determinación o medición del nivel de expresión de. la invención. La base de datos puede estar en cualquier forma, o formas electrónicas tal como una base de datos implementada en computadora incluida dentro del alcance de la invención. La indicación puede estar en la forma de un código sobre papel o en la base de datos. El "otro pagador" ' puede ser cualquier persona o entidad más allá de que quien una petición previa se hizo para el reembolso o pago. De manera alternativa, el método puede comprender recibir el reembolso o pago para el desempeño técnico o actual del método anterior en el cuidado médico de un paciente; para la interpretación de los resultados del método; o por cualquier otro método de la invención. Por supuesto la invención también incluye modalidades que comprenden instruir a otra persona o parte para recibir el reembolso o pago. El ordenamiento puede' ser cualquier medio de comunicación, incluyendo aquellos descritos en lo anterior. El recibo puede ser de cualquier entidad, incluyendo una compañía aseguradora, organización de mantenimiento de la salud, agencia de la salud gubernamental, o un paciente como ejemplo no limitativos. El pago puede ser por completo o en parte. En el caso de un paciente, el pago puede estar en la forma de un pago parcial conocido como un co-pago . En todavía otra modalidad, el método puede comprender 'adelantar o tener adelantado una petición de reembolso o pago a una compañía aseguradora, organización de mantenimiento de la salud, agencia de la salud gubernamental o un paciente para el desempeño del método anterior en un cuidado médico de un paciente u otro método de la invención. La petición puede ser mediante cualquier medio de comunicación, incluyendo aquellos descritos en lo anterior. En una modalidad adicional, el método puede comprender recibir la indicación de la aprobación para el pago, o negación del pago-, para el desempeño del método anterior en el cuidado médico de un paciente u otro método de la invención. Tal indicación' puede provenir de cualquier persona o parte a quien se hizo una petición para el reembolso o pago. Ejemplos no limitativos incluyen una compañía aseguradora, organización de mantenimiento de la salud o agencia de la salud gubernamental, similar a Medicare o Medicaid como ejemplos no limitativos. La indicación puede ser mediante cualquier medio de comunicación, incluyendo aquellos descritos en lo anterior. Una modalidad adicional es donde el método comprende enviar una petición para el reembolso para el desempeño del método anterior en el cuidado médico de un paciente u otro método de la invención. Tal petición puede ser por cualquier medio de comunicación, incluyendo aquellos descritos en lo anterior. La petición puede haber sido hecha a una compañía aseguradora, organización de mantenimiento en la salud, agencia de la salud federal o al paciente de quien se realizó el método.
Un método adicional comprende indicar la necesidad para el reembolso o pago en una forma o una base de datos para el desempeño del método anterior en el cuidado médico de un paciente u otro método de la invención. Alternativamente, el método puede simplemente indicar el desempeño del método. La base de datos puede estar en cualquier forma, con formas electrónicas tal como la base de datos implementada en computadora incluida dentro- del alcance de la invención. La indicación puede estar en la forma de un código sobre papel o en la base de datos . En . los métodos anteriores en el cuidado médico de un paciente u otro método de la invención, el método puede comprender ei reporte de los resultados dei método, opcionalmente a una instalación del cuidado de la salud, un proveedor o profesional del .cuidado de la salud, un doctor, una enfermera, o. personal que trabaja para el mismo. El reporte también puede ser directamente o indirectamente al paciente. El reporte puede ser mediante cualquier medio de comunicación, incluyendo aquellos descritos en lo anterior. La invención además proporciona equipos para la determinación o medición de los niveles de expresión de gen en una muestra que contiene células como es descrito en la presente. Un equipo típicamente comprenderá uno o más reactivos para detectar la expresión de gen como es descrito en la presente para la práctica de la presente invención.
Ejemplos no limitativos incluyen sondas o cebadores de polinucleótido para la detección de niveles de expresión, una o más enzimas utilizadas en los métodos de la invención, y uno o más tubos para el uso en la práctica de la invención. En algunas modalidades, el equipo incluirá un arreglo, o medio sólido capaz de ser ensamblado en un arreglo, para la detección de la expresión de gen, como es descrito en la presente. En otras modalidades, el equipo puede comprender en uno o más anticuerpos que son inmunoreactivos con epítopes presentes sobre un polipéptido que indica la expresión de una secuencia de gen. En algunas modalidades, ei anticuerpo será un fragmento de anticuerpo. Un equipo de la invención también puede incluir materiales de instrucción que divulgan o describen el uso del equipo o un cebador o sonda de la presente invención en un método de la invención como es proporcionado en la presente. Un equipo también puede incluir componentes adicionales para facilitar la aplicación particular para la cual se diseña el equipo. Así, por ejemplo, un equipo adicionalmente puede contener medios para detectar la marca (por ejemplo, sustratos de enzima para marcas enzimáticas, conjuntos de filtros para detectar marcas fluorescentes, marcas secundarias apropiadas tal como el HRP anti-ratón de oveja y los similares) . Un equipo adícionalmente puede incluir soluciones reguladoras y otros reactivos reconocidos para el uso en un método de la invención. Habiéndose ahora generalmente descrito en la invención, la misma será más fácilmente entendida a través de la referencia de los siguientes ejemplos que se proporcionan a manera de ilustración, y no se proponen para ser limitativos de la presente invención, a menos que sea especificado. EJEMPLOS Ejemplo .1: Materiales y Métodos La siguiente tabla muestra los tipos y el número de muestras de tumores conocidos utilizados en el Ejemplo 2. Tipo de Tumor Número de Muestras Adrenal 7 Cerebro-glial- 16 Cerebro-Meningioma 7 Seno 43 Cerviz-adeno 8 Cerviz-escamoso 13.
Endometrio 13 Vesícula Biliar 5 Célula germinal 22 GIST . 10 Riñon 11 Leiomiosarcoma - 13 Hígado 14 Pulmón-adeno _ 9 Pulmón-grande 9 Pulmón-pequeño 8 Pulmón-escamoso 10 Linfoma-B 7 Linfoma de Hodgkins 9 Linfoma-T 5 Mesotelioma . 10 Osteosarcoma ' 7 Ovario claro . 14 Ovario seroso 14 Páncreas 24 Próstata 11 Célula basal de la piel • 5 Melanoma de la piel 10 Piel escamosa 6 Intestino delgado y grueso . 42 Liposarcoma de tejido blando. ' 5 MFH de tejido blando ' 11 Sarcoma-sinovial de tejido blando 7 Estómago-adeno 9 Testis-Seminoma 10 Tiroides-folicular-papilar 12 Tiroid s-medular 7 Vejiga urinaria 25 Total 468 Conducto biliar 1 Colangiocarcinoma 4 Esófago 2 Esófago-Barretts 4 Esófago-escamosa 4 HN-escamoso 3 Ovario (no clasificado) 1 Ovario-endometroide 1 Ovario-mucinoso • 4 Ovario-estromal 1 -Sarcoma-Ewings de tejido blando 2 Fibrosarcoma de tejido blando 2 Rabdomiosarcoma de tejido blando -3 Total 32 Las 500 muestras fueron muestras frescas o congeladas de tejido que contiene tumor. Las 468 muestras tomadas en lo anterior se utilizaron para experimentos adicionales al tomar 374 como en el conjunto de entrenamiento y las 94 muestras restantes como el conjunto de prueba. Los tipos de tumor de menos de 5 muestras no se utilizaron inicialmente . Las muestras contuvieron tumores tanto primarios como metastáticos con una diagnosis confirmada. Una sección de 5 µm individual se manchó (H+E) y el tumor se visualizó. Las poblaciones de tumor puro se obtuvieron ya sea por disección manual o la microdisección de captura de láser (Arcturus, Mountain View, CA) . La extracción de RNA y el control de calidad se realizaron en cada muestra. Brevemente, las muestras se procesaron utilizando un método . de extracción basado en columna de giro de sílice (Arcturus, Mountain View, CA) . La cantidad total de RNA extraído se estimó utilizando la PCR cuantitativa (Taqman, ABI), con cebadores específicos para la transcripción de ß-actina. Se amplificaron solamente muestras con mayor que 10 ng de RÑA. Las muestras se amplificaron utilizando un protocolo de amplificación de 2 rondas de RNA polimerasa modificado (Arcturus, Mountain View, CA) . Después de la amplificación, el rendimiento de producto de RNA se cuantificó mediante espectroscopia de OD(260/280), y el producto amplificado se visualizó mediante la electroforesis en gel desnaturalizante- de agarosa (2%). El producto amplificado de cada muestra luego se híbrido a un microarreglo para detectar el nivel de expresión de transcripto en las muestras. La selección del gen - aleatorio se realizó utilizando el software de función de muestreo aleatorio. Para cada número de genes seleccionados, las muestras aleatorias se seleccionaron 100 veces y se utilizaron para calcular las precisiones de validación cruzada y predictivas en ambos conjuntos de entrenamiento y de prueba. La validación cruzada fue al dividir el conjunto de entrenamiento en partes con uno que es utilizado para entrenar y otro que es utilizado como una prueba. Ejemplo 2: Resultados La media de las precisiones de 100 -muéstreos y el 95% de intervalo de confidencia se calcularon y se graficaron para cada etapa de 50 a 16948 genes. Las gráficas mostraron las precisiones de validación cruzada y predictivas del algoritmo KNN (k-vecino más cercano) contra el número de se utilizaron los genes seleccionados por oportunidad. La selección del gen aleatorio utilizó la función del muestreo aleatorio en el software R. 50 o más se utilizaron los genes fueron capaces de clasificar precisamente entre los numerosos tipos de tumor in toto con una precisión mejor que 50%. Resultados similares se observaron con el uso de las muestras y KNN con muestras de tumor FEPE conocidas en las cuales el RNA se extrajo y se analizó para la expresión de gen. Se debe observar que mientras que la precisión estabilizada con el uso de genes adicionales, se espera que hay conjuntos particulares de 50 o más genes que tienen precisiones significativamente más altas. La clasificación de tipos de tumores adicionales, tales como aquellos que totalizan 32 muestras en la tabla anterior, se puede hacer con la inclusión de muestras adicionales . El nivel de precisión de un conjunto de 100 secuencias de gen expresadas aleatoriamente seleccionadas se determinó que es 66% y se utilizó como es descrito- en el Ejemplo 3 para generar las Figuras 1 y 2. Ejemplo 3: Capacidad de información de los conjuntos de genes aleatorios. Subconjuntos de las 100 secuencias de gen expresadas aleatoriamente seleccionadas, utilizadas para clasificar entre 39 tipos de tumor se probaron por su habilidad para clasificar entre subconjuntos de los 39 tipos de tumor. Los niveles de expresión de las combinaciones aleatorias de 50, '55, 60, 65,70, 75, 80, 85, 90, 95 y todos los 100 (cada combinación se muestreó 10 veces) de las 100 secuencias expresadas se utilizaron con datos de tipos de tumor y luego se utilizaron para predecir los conjuntos aleatorios de pruebas de muestra de tumor (cada una muestreada 10 veces) que varía de 2 a todos los 39 tipos. La Figura 1 muestra la capacidad de clasificación de varios conjuntos de genes que se muestran con relación al número de tipos de tumor clasificados. Como es esperado, un número más alto de secuencias de gen son necesarias para clasificar tipos de tumor con precisiones más altas. La Figura 2 muestra el desempeño de clasificación para varios números de tipos de tumor con relación al número de secuencias de gen utilizadas. Los números de acceso de GenBank de las 100 secuencias de gen son AF269223, BC006286, AK025501, AJ002367, AI469140, AW013883, NM_001238, AI476350, BC006546, AI041212, BF724944, AI376951, R56211, BC006393, X13274, BC001133, - M62397, BC000885, AK001588, AK057901, AF146760, AI951287, ' AK025604, .BC007581, BC015025, R43102, A 449550, AI922539, AI684144, AI277662, BC015999, A 444656, BC011612, BC015401, BF447279, BC009956, AL050163, BC001248, BE672684, AL137353, BC001340, U45975, BE856598, BC009060, AL137728, AA713797, AL583913, AK054617, AI028262, AI753041, BG939593, AL080179, AA814915, AF131798, AI961568, BC009849, AK021603, BC012561, AI570494, BC006973, AW294857, BC004952, AK026535, AI923614, A 082090, AI005513, AF339768, AK023167, AF169693, AF076249, BC007662, BC015520, AI814187, AI565381, AW271626, AK024120, AF139065, BC014075, AI887245, AF257081, AI767898, AF070634, AF155132, X69804, U65579, NM_004933, AI655104, AW131780, AI650407, AF131774, AA814057, AJ311123, BC009702, AF264036, AL161961, AJ010857, AF106912, AK023542, AF073518, y D83032. Ellos se indexaron de 1 a 100, y conjuntos representativos, y no limitativos aleatorios utilizados en la invención son como sigue: Para 50-genes, conjunto 1, se utilizaron los genes 9, 52, 55, 24, 44, 58, 20, 79, 81, 86, 22, 84, 27, 32, 73, 70, 18, 41, 54, 38, 46, 78, 87, A 9 , 15, 95, 12, 23, 30, 13, 36, 98, 28, 56, 21, 19, 35, 51, 25, 43, 99, 34, 64, 66, 82, 72, 11, 92, 59 y 71. En el conjunto 2, se utilizaron los genes 72, 92, 27, 8, 14, 87, 42, 83, 65, 85, 40, 21, 74, 66, 6, 28, 13, 98, 91, 78, 49 , 52, 33, 30, 97, 84, 2, 95, 88, 64, 93, 11, 1, 45, 61, 39, 12, 67, 53, 89, 43, 17, 54, 7, 55, 38, 3, 15, 70 y 31. En el conjunto 3, se utilizaron los genes 9, , 87, 52, 73, 74, 88, 22, 41, 28, 93, 15, 67, 20, 68, 17, 46, 43, 51, 24, 84, 79, 19, 100, 76, 6, 49, 97, 16, 59, 89, 66, 45, 63, 2, 27, 13, 98, 69, 60, 26, 86, 83, 58, 71, 54, 82, 32, 42 y 77. En el conjunto 4, se utilizaron los genes 34, 67, 48, 53, 24, 61, 6, 64, 89, 76, 35, 21, 86, 83, 68, 7 ,' , 65, 58, 28, 97, 90, 31, 57, 3, 50, 2, 96, 84, 29, 42, 46, 82, 62, 19, 95, 44, 52, 33, 36, 15, 37, 70, 11, 43, 13, 8, 49, 16 y 99. En el conjunto 5, se utilizaron ios genes 11, 22, 87, 25, 5, 38, 35, 68, 94, 51, 60, 53, 20, 42, 95, 92, 33, 15, 14, 24, 85, 37, 69, 17, 19, 93, 8, 97, 46, 83, 26, 86, 66, 89, 63, 16, 74, 28, 52, 2, 96, 99, 71, 10, 65, 90, 29, 34, 77 y 45. En el conjunto 6, se utilizaron los genes 62, 6, 69, 12, 19, 50, 51, 5, 1, 32, 41, 84, 27, 10, 93, 28, 79, 21, 88, 47, 58, 64, 74, 39, 33, 46, 17, 86, 87, 4, 60, 98, 97, 45, 26, 72, 40, 63, 30, 54, 52, 11, 15, 96, 14, 24, 73, 67, 59 y 38. En el conjunto 7, se utilizaron los genes 67, 21, 62, 15, 59, 6, 23, 30, 89, 94, 82, 74, 96, 17, 41, 38, 48, 100, 5, 71, 20, 55, 79, 28, 44, 64, 92, 65, 51, 37, 32, 22, 72, 98, 12, 54, 78, 50, 60, 76, 8.8, 3, 40, 80, 77, 16, 24, 42, 8 y 14. En el conjunto 8, se utilizaron los genes 43, 68, 8, 38, 82, 73, 12, 23, 77, 63, 56, 33, 66, 14, 47, 17, 53, 62, 42, 57, 30, 89, 44, 58, 34, 24, 81, 40, 45, 1, 99, 52, 37, 80, 96, 10, 71, 50, 20, 51, 18, 54, 31, 70, 84, 3, 83, 76, 59 y 91. En el conjunto 9, se utilizaron los genes 36, 90, 34, 79, 29, 24, 44, 51, 27, 58, 52, 37, -68, 49, 89, 80, 57, 8, 22, 77, 54, 65, 26, 91, 21, 64, 59, 61, 13, 74, 87, 50, 63, 20, 78, '23, 96, 67, 30, 55, 81, 35, 72, 56, 95, 82, 39, 42, 88 y 92. En el conjunto 10, se utilizaron los genes 59, 94, 91, 88, 3, 45, 13, 96, 66, 58, 60, 69, 21, 95, 4, 7, 67, 83, 44, 2, 37, 24, 8, 12, 53, 47, 34, 9, 31, 46, 11, 68, 1, 6, 29, 14, 33, 54, 43, 80, 39, 18, 100, 10, 84, 65, 5, 76, 26 y 22. Para 55 genes, conjunto 1, se utilizaron los genes 20, 76, 33, 73, 15, 83, 47, 2, 95, 67, 26, 49, 97, 25, 46, 13, 51, 42, 14, 11, 39, 94, 37, 100,. 56, 63, 6, 66, 45, 75, 3, 78, 55, 7, 72, 44, 35, 48, 65, 38, 60, 90, 30, 36, 77, 23, 16, 32, 80, 89, 8, 91, 43, 50, y 28. En el conjunto 2, se utilizaron los genes 11, 63, 93, 79, 21, 57, 66, 10, 42, 83, 75, 94, 3, 38, 49, 91, 53, 90, 50, 52, 39, 99, 85, 48, 31, 18, 89, 25, 87, 56, 40, 5, 19, 88, 27, 92, 20, 100, 59, 43, 95, 80, 86, 44, 55, 68, 54, 33, 96, 45, 2, 9, 81, 73, y 37. En el conjunto 3, se utilizaron los genes 20, 73, 76, 29, 44, 33, 84, 98, 15, 69, 32, 14, 50, 70, 63, 41, 87, 74, 99, 34, 23, 36, 37, 68, 89, 43, 91, 18, 26, 45, 9, 90, 28, 92, 7, 30, 22, 54, 96, 72, 16, 38, 58, 52, 56, 79, 57, 47, 83, 17, 49, 2, 80, 51, y 46. En el conjunto 4, se utilizaron los genes 90, 63, 60, 82, 81, 50, 25, 24, 56, 9, 8, 89, 70, 55, 15, 4, , 75, 77, 46, 87, 6, 49, 85, 98, 58, 28, 27, 64, 47, 99, 51, 86, 21, 54, 80, 41, 74, 88, 14, 36, 2, 23, 32, 19, 30, 52, 84, 62, 37, 43, 53, 72, 39, y 92. En el conjunto 5, se utilizaron los genes 27, 43, 33, 84, 89, 31, 60, 97, 15, 45, 42, 73, 4, 6, 90, 61, 72, 56, 2, 38, 96, 74, 94, 14, 25, 77, 58, 86, 21, 32, 82, 3, 50, 17, 28, 48, 44, 7, 70, 20, 59, 83, 1, 71, 52, 95, 69, 54, 39, 46, 63, 51, 57, 34, y 22. En el conjunto 6, se utilizaron los genes 96, 12, 94, 27, 11, 33, 25, 22, 26, 50, 6-0, 70, 68, 30, 82, 34, 17, 32, 29, 19, 87, 76, 81, 7, 55, 35, 45, 56, 31, 99, 5, 24, 54, 97, 21, 92, 98, 36, 88, 23, 58, 77, 14, 95, 9, 73, 84, 61, 2, 38, 83, 65, 42, 74, y 48. En el conjunto 7, se utilizaron los genes 52, 11, 79, 27, 23, 64, 96, 33, 75, 12, 34, 94, 26, 78, 67, 51, 57, 70, 28, 89, 9, 98, 62, 91, 41, 65, 73, 74, 8, 16, 90, 37, 1, 10, 59, 81, 63, 30, 80, 18, 15, 48, -36, 19, 84, 14, 45, 38, 97, 99, 3, 82, 54, 22, y 5. En el conjunto 8, se utilizaron los genes 83, 57, 6, 37, 44, 76,' 5, 59, 74, 62, 72, 23, 93, 75, 32, 100, 98, 29, 30, 65, 21, 17, 78, 46, 13, 82, 14, 50, 66, 63, 90, 49, 54, 68, 60, 10, 87, 9.4, 58, 91, 33, 31, 36, 8, 11, 92, 51, 38, 43, 52, 7, 86, 89, 84, y 70. En el conjunto 9, se utilizaron los genes 29, 100, 79, 21, 63, 12, 51, 2, 18, 77, 81, 33, 68, 69, 13, 23, 37, 39, 14, 3, 93, 36, , 35, 30, 40, 28, 61, 49, 71, 27, 99, 75, 96, 83, 97, 78, 54, 19, 89, 62, 38, 8, 53, 26, 43, 52, 25, 58, 9, 31, 86, 65, 6, y 60. En el conjunto 10, se utilizaron los genes 7, 37, 22, 39, 41, 89, 57, 75, 6, 23, 47, 51, 55, 93, 49, 5, 15, 79, 20, 11, 42, 87, 78, 33, 68, 76, 94, 77, 62, 16, 31, 54, 28, 99, 90, 61, 25, 21, 59, 73, 83, 95, 30, 91, 65, 24, 4, 17, 10, 72, 63, 98, 34, 69 , y 1. Para 60 genes, conjunto 1, se utilizaron los genes 67, 60, 53, 20, 3, 9, 87, 16, 1, 14, 96, 82, 79, 94, 35, 32, 44, 22, 17, 46, 59, 29, 40, 57, 68, 52 ,48, 31, 34, 23, 91, 38, 92, 49, 51, 86, 88, 55, 50, 39, 83, 65, 11, 42, 4, 63, 47, 73, 84, 75, 77, 18, 74, 100, 26, 5, 72, 10, 90, y 76. En el conjunto 2, se utilizaron los genes 62, 67, 70, 82, 8, 10, 26, 45, 98, 38, 76, 14, 72, 36, 89, 95, 86, 96, 18, 91, 75, 74, 7, 46, 16, 83, 65, 33, 29, 57, 32, 42, 34, 37, 80, 100, 99, 9, 2, 22, 64, 11, 87, 35, 23, 55, 60, 61, 81, 49, 5, 58, 3, 40, 71, 54, 85, 94, 66, y 20. En el conjunto 3, se utilizaron los genes 49, 10, 76, 94, 83, 90, 42, 57, 38, 85, 29, 1, 60, 71, 65, 30, 64, 23, 72, 27, 70, 13, 100, 43, 20, 44, 4, 88, 79, 24, 84, 91, 87, 41, 21, 48, 54, 68, 16, 35, 6, 89, 2, 34, 96, 22, 99, 52, 28, 3, 15, 47, 7, 61, 63, 75, 19, 97, 56, y 39. En el conjunto 4, se utilizaron los genes 99, 94, 58, 51, 46, 87, 77, 23, 9, 74, 52, 4, 47, 42, 5, 62, 48, 14, 35, 32, 75, 98, 95, 18, 67, 76, 50, 8, 1, 19, 22 ,72, 11, 83, 82, 89, 12, 24, 90, 80, 92, 85, 26, 66, 38, 78, 79, 60, 49, 59, 25, 84, 36, 29, 45, 55, 27, 70, 39, y 57. En el conjunto 5, se utilizaron los genes 39, 21, 70, 81, 88, 30, 2, 57, 45, 5, 47, 93, 1, 34, 51, 49 , 3, 6, 65, 97, 41, 67 95, 85, 98, 29, 82, 38, 17, 84, 72, 52, 20, 33, 53, 66, 7 54, 25, 23, 80, 61, 76, 9, 14, 48, 26, 12, 32, 4, 64, 73, 56 87, 59, 35, 31, 62, 13, y 15. En el conjunto 6, se utilizaron los genes 99, 80, 35, 87, 17, 27, 53, 43, 38, 45, 61, 34, 81 3, 16, 42, 24, 37, 19, 39, 59, 6, 28, 74, 32, 92, 18, 31, 25 66, 79, 41, 51, 97, 58, 7, 49, 70, J l , 33, 78, 85, 63, 72 89, 15, 40 , 29, 46, 1, 73, 68, 56, 54, 47, 5, 65, 100, 44, y 22. En el conjunto 7, se utilizaron los genes 15, 51, 66, 47 4, 82, 78, 71, 72, 75, 61, 10, 34, 18, 12, 55, 32, 80, 45 14, 3, 62, 20, 74, 96, 48, 94, 88, 69, 64, 86, .9, 24, 41, 8 28, 81, 13, 37, 87, 53, 44, 57, 43, 30, 38, 67, 5, 100, 91 50, 2, 42, 77, 7, 83, 73, 99, 68, y 6. En el conjunto 8, se utilizaron los genes 41, 21, 20, 62, 50, 86, 13, 23, 94, 45 80, 51, 42, 52, 47, 76, 18, 72, 25, 8, 35, 58, 37, 32, 46 71, 99, 33, 48, 77, 38, 19, 44, 66, 7, 53, 12, 10, .74, 96 84, 28, 30, 15, 2, 81, 7, 26, 79, 88, 24, 49, 65, 17, 95, 63 75, 11, 55, y 36. En el conjunto 9, se utilizaron los genes 14, 40, 30,. 48, 37, 3, 28, 57, 58, 22, 70, 74, 91, 98, 46 - 76, 81, 65, 54, 23, 11, 34, 17, 53, 26, 67, 80, 42, 86, '73 25, 24, 9, 88, 38, 45, 13, 56, 83, 87, 31, 36, 43, 100, 35 41, 16, 33, 61, 6, 49, 63, 71, 64, 96, 8, 19, 39, 68, y 84. En el conjunto 10, se utilizaron los genes 97, 39, 83, 8, 35, 13, 96, 20, 19, 69, 10, 81, 57, 65, 17, 12, 48, 86, 4, 25, 92, 22, 55, 43, 34, 45, 73, 18, 31, 15, 2, 61, 51, 89, 82, 68, 46, 24, 77, 27, 88, 72, 16, 37, 70, 29, 60, 14, 23, 44, 49, 66, 62, 32, 28, y 98. Para 65 genes, conjunto 1, se utilizaron los genes 57, 82, 75, 62, 43, 41, 76, 59, 34, 78, 95, 32, 79, 88 4, 89, 96, 84, 66, 10, 31,- 23, 52, 16, 85, 98, 28, 25 69, 39, 63, 64, 58, 65, 30, 13, 19, 40, 50, 48, 6, 93, 2 51, 100, 26, 27, 24, 1, 87, 91, 38, 5, 21, 56, 35, 61 90 , 94, y 83. En el conjunto 2, se utilizaron los genes 33, 59, 65, 12, 97, 20, 99, 13, 64, 29, 23, 49, 35, 66 77, 46, 14, 11, 81, 32, 42, 34, 70, 17, 54, 44, 24, 53 ., 71, 47, 96, 80, 86, 40, 15, 37, "90, 67, 73, 50, 25, 51 75, 72, 92,. 93, 4, 84, 18, 76, 21, 38, 88, 68, 9, 60, 52 7, y 41. En el conjunto 3, se utilizaron los genes 12 56, 70, 50, 95, 15, 85, 93, 53, 45, 47, 10, 99, 32, 76 89, 83, 35, 91, 62, 6, 84, 23, 52, 65, 9, 37, 4, 51, 42 49, 100, 21, 5, 43,' 75, 92, 98, 36, 16, 27, 19, 22, 82 58, 63, 34, 74, 3, 71, 87, 72, 81, 1, 68, 46," 55, 88, 64 11, y 33. En el conjunto 4, se utilizaron los genes 16, 41 15, 40, 19, 47, 77, 96, 5, 21, 38, 84, 22, 27, 81, 46, 74 36, 8, 52, .98, 87, 91, 54, 86, 80, 25, 39, 75, 42, 10, 83 51, 90, 62, 78, 17, 9, 53, 68, 12, 100, 24, 89, 20, 58, 59 11. 92, 32, 30, 95, 49, 55, 73, 82, 99, 70, 97, 13, 6, 93 67, 29, y 45. En el conjunto 5, se utilizaron los genes 94 3, 31, 85, 51, 80, 8, 55, 22, 93, 97, 49, 14, 81, 67, 76, 77, 75, 19, 59, 5, 72, 34, 62, 58, 43, 7, 44, 35, 98, 24, 74, 41, 73, 63, 13, 87, 56, 15, 42, 12, 91, 50, 37, 29, 40, 53, 83, 2, 99, 100, 1, 10, 33, 16, 26, 9, 71, 39, 11, 46, 57, 66, 92, y 82. En el conjunto 6, se utilizaron los genes 86, 55, 15, 9, 13, 94, 33, 16, 14, 11, 32, 59, 88, 64, 90, 50, 45, 82, 7, 44, 48, 98, 21, 51, 62, 99, 75, 25, 19, 41, 24, 26, 17, 23, 6, 71, 72, 47, 42, 2, 85, 22, 56, 81, 78, 79, 43, 18, 100, 36, 34, 70, 39, 80, 66, 97, 58, 31, 30, 57, 35, 96,' 12, 29, y 10. En el conjunto 7, se utilizaron los genes 16, 50, 4, 18, 60, 65, 37, 94, 1, 88, 76, 71, 31, 2, 53, 59, 19, 26, 28, 89, 87, 77, 63, 57, 92, 55, 20, 93, '72, 38, 46, 62, 45, 11, 52, 95, 54, 14, 36, 42, 39, 64, 7, 99, 86, 78, 27, 43, 66, 58, 25, 81, 79, 41, 90, 13, 73, 67, 32, 44, 23, 34, 29, 6, y 35. En el conjunto 8, se utilizaron los genes 8, 53, 3, 33, 84, 61, 74, 98, 31, 9, 55, 62, 4, 88, 27, 50, 85, 34, 69, 83, 99, 17, 25, 19, 40, 90, 45, 30, 28, 92, 93, 75, 95, 37, 6, 24, 79, 96, 70, 60, 91, 52, 89, 49, 10, 100, 39, 77, 41, 23, 29, 20, 22, 5, 16, 59, 21, 46, 80, 32, 73, 72, 2, 26, y 48. En el conjunto 9, se utilizaron los genes 98, 82, 24, 35, 25, 93, 5, 56, 76, 96, 2 , 78, 40, 13, 83, 86, 92, 77, 81, 29, 58, 99, 97, 80, 18, 27, 1, 65, 14, 16, 59, 20, 26, 67, 32, 22, 90, 37, 85, 7, 41, 34, 4, 68, 45, 12, 79, 62, 17, 75, 84, 91, 54, 72, 57, 10,' 95, 44, 52, 9, 28, 89, 100, 33, y 21. En el conjunto 10, se utilizaron los genes 96 ,40, 22, 50, 75, 38, 98, 89, 55, 60, 86, 18, 87, 85, 49, 2, 57, 73, 33, 29, 59, 42, 63, 68, 62, 92, 74, 53, 8, 7, 51, 71, 11, 30, 83, 56, 77, 81, 79, 16, 37, 69, 61, 64, 27, 67, 25, 100, 31, 3, 13, 4, 12, 21, 65, 99, 36, 66, 6, 94, 44, 35, 72, 95, y 90. Para 70 genes, conjunto 1, se utilizaron los genes 36, 6, 100, 39, 37, 3, 27, 45, 93, 19, 89, 43, 68, 9, 60, 46, 51, 80, 32, 52, 62, 35, 58, 14, 10, 33, 85, 12, 64, 67, 75, 86, 17, 44, 83, 24, 87, 84, 23, 96, 79, 20, 13, 8, 11, 76, 88, 56, 38, 98, 29, 16, 99, 2, 66, 30, 48, 26, 5, 25, 78, 42, 47, 94, 15, 4, 55, 65, 97, y 71. En el conjunto 2, se utilizaron los genes 96, 98, 38, 32, 52, 25, 31, 14, 91, 53, 8, 94, 49, 27, 69, 20, 44, 4, 92, 56, 61, 97, 18, 65, 66, 54, 21, 3, 29, 79, 80, 70, 77, 50, 39, 99, 58, 23, 85, 51, 15, 72, 33, 19, 24, 68, 7, 41, 81, 64, 57, 73, 84, 46, 22, 74, 11, 45, 55, 82, 6, 47, 59, 42, 88, 9, 16, 34, 83, y 30. En el conjunto 3, se utilizaron los genes 27, 46, 30, 54, 47, 94, 26, 38, 73, 31, 43, 8, 50, 48, 6, 56, 59, 25, 89, 52, 78, 68, 49, 29, 83, 92, 97, 98, 4, 3, 95, 87, 23, 1, 51, 44, 34, 35, 85, 61, 22, 84, 42, 13, 75, 93, 45, 88, 19, 80, 39, 24, 77, 2, 55, 62, 11, 90, 18, 81, 57, 20, 96, 28, 7, 70, 86, 5, 63 , y 69. En el conjunto 4, se utilizaron los genes 65, 29, 88, 19, 42, 30, 15, 16, 74, 53, 25, 8, 95, 5, 69, 99, 59, 67, 84, 14, 80,.12, 37, 13, 71, 39, 43, 100, 60 , 79, 51, 11, 45, 82, 83, 61, 62, 90, 6, 20, 2, 18, 97, 1, 48, 81, 35, 87, 56, 36, 93, 41, 54, 46, 10, 27, 47, 33, 55, 64, 26, 57, 85, 89, 9, 96, 72, 68, 23, y 32. En el- conjunto 5, se utilizaron los genes 25, 41, 56, 91, 19, 22, 63, 39, 59, 83, 7, 74, 20, 86, 84, 2, 43, 73, 69, 58, 35, 26, 23, 42, 29, 10, 13, 77, 16, 72, 71, 81, 40, 66, 80,' 50, 12, 48., 64,, 100, 24, 94, 97, 57, 98, 68, 78, 92, 53, 31, 45, 38, 61, 75, 5, 1, 44, 99, 3, 36, 88, 34, 21, 17, 15, 89, 37, 51, 85, y 79. En el conjunto 6 se utilizaron los genes 59, 78, 34, 83, 5, 11, 60, 97, 3, 9 , 90, 33, 8, 31, 10, 80, 7, 92, 15, 23, 72, 14, 86, 82, 18 42, 88, 94 , 48, 79, 73, 77, 52, 95, 16, 87, 28, 98, 71, 74 21, 67, 6, 66, 35, 99, 29, 32, 75, 26, 39, 47, 45, 50, 41 54, 1, 84, 85, 91, 100, 61, 12, 37, 4, 25, 55, 46, y 13. En el conjunto 7, se utilizaron los genes 63, 14, 66, 75, 12, 2 90, 81, 27, 72, 70, 89, 59, 46, 6, 53, 22, 80, 30, 79, 82 71, 92, 19, 73, 83, 38, 40, 1, 68, 20, 8, 50, 74, 94, 26, 35 28, 43, 34, 77, 18, 96, 16, 95, 85, 15, 9, 11, 84, 39, 10 54, 65., 57, 25, 60, 51, 55, 33, 17, 44, 29, 58, 93, 62,. 21 4, 7, y 78. En el conjunto 8, se utilizaron los genes 60 , 76 17, 29, 68, 24, 54, 87, 16, 66, 15, 8, 85, 92, 67, 100, 82 74, 41, 33, 3, 35, 94, 78, 58, 75, 98, 63, 95, 12, 47, 81 91, 9, 7, 83, 77, 22, 89, 56, 49, 31, 96, 2, 70, 23, 46, 6 39, 90, 59, 71, 44, 10, 36, 52, 42, 86, 5, 64, 55, 69, 84, 28, 93, 53,- 38, 27, 13, y 26. En el conj.unto 9, ' se utilizaron los genes 21, 24, 41, 29, 92, 30, 51, 31, 83, 71, 37, 23, 11, 53 14, 93, 45, 69, 52, 56, 70, 68, 3, 79, 26, 58, 66, 15, 50 95, 16, 2, 4, 5, 28, 42, 34, 9, 82, '6, 63, 44, 87, 32, 59, 80, 55, 96, 54, 89, 22, 94, 36, 46, 40, 86, 98, 38, 67, 85, 35, 60 , 25, 1, 78, 61, 17, 64, 7, y 91. En el conjunto 10, se utilizaron los genes 93, 44, 77, 3, 31, 64, 39, 89, 23, 51, 78, 85, 35, 81, 22, 74, 97, 14, 27, 13, 16, 88, 28, 61, 57, 79, 99, 37, 30, 36, 24, 11, 45, 34, 54, 50, 41, 1, 7, 48, 56, 63, 58, 49, 17, 26, 15, 69, 2, 53, 43, 62, 55, 100, 95, 52, 83, 29, 19, 38, 59, 76, 20, 87, 66, 25, 72, 70, 4, y 73. Para 75 genes, conjunto 1, se utilizaron los genes 73, 40, 56, 32, 59, 42, 70, 12, 100, 6, 28, 11, 43, 55, 5, 64, 80, 99, 23, 57, 18, 82, 60, 61, 31, 81, 14, 3, 91, 76, 86, 19, 26, 83, 38, 29, 8, 36, 69, 85, 96, 27, 47, 10, 35, 39, 94, 24, 62, 34, 54, 65, 25, 90, 51, 67, 41, 46, 33, 1, 37, 49, 9, 71, 13, 21, 44, 2, 98, 52, 84, 20, 74, 93, y 88. En ei conjunto 2, se utilizaron los genes 26, 21, 43, 56, 15, 55, 9, 34, 58, 12, 85, 44, 20, 99, 74, 35, 39, 88, 53, 8, 92, 67, 6, 48, 69, 28, 23, 87, 71, 5, 72, 89, 38, 100, 25, 1, 13, 3, 14, 29, 96, 62, 64, 90, 78, 63, 68, 66, 11, 41, 77, 42, 4, 60, 24, 98, 18, 17, 52,- 46, 30, 32, 70, 33, 31, 83, 45, 36, 84, 95, 82, 80, 22, 50, y 73. En el conjunto 3, se utilizaron los genes 96, 11, 58, 14, 77, 32, 6, 28, 55, 12, 40, 72, 83, 7, 89, 67, 51, 63, 95, 15, 74, 99, 88, 81, 84, 38, 36, 13, 87, 5, 69, 62, 19, 86, 90, 76, 66, 33, 52, 4, 20, 78, 59, 27, 17, 2, 43, 75, 64, 79, 53, 26, 3, 42, 100, 48, 71, 85, 41, 25, 61, 57, 49, 70, 37, 80, 24, 94, 30, 54, 9, 35, 21, 16, y 22. En el conjunto 4, se utilizaron los genes 48, 31, 73, 90, 10, 100, 32, 56, 83, 38, 93, 7, 53, 8, 79, 15, 63, 5, 92, 76, 58, 59, 35, 67, 2, 98, 23, 37, 24, 94, 25, 9, 46,. 36, 82, 40, 89, 27, 34, 71, 84, 97, 86, 6, 21, 54, 22, 72, 17, 44, 26, 57, 64, 11, 91, 75, 80, 95, 62, 88, 51, 39, 99, 69, 43, 68, 42, 52, 16, 4, 30, 77, 81, 60, y 50. En el conjunto 5, se utilizaron los genes 86, 46, 90, 79, 40, 99, 53, 67, 97, 82, 7, 15, 49, 71, 94, 48, 68, 80, 20, 51, 19, 96, 100, 38, 91, 83, 50, 33, 76, 66, 93, 22, 74', 85,. 45, 31, 10, 62, 84, 25, , 88, 77, 43, 78, 69, 24, 61, 57, 41, 56, 63, 32, 16, 59, 12, 4, 14, 28, 87, 44, 65, 55, 98, 35, 9, 64 , 75, 47, 89, 18, 52, 36, 29, 54, y 81. En el conjunto 6, se utilizaron los genes 70, 47, 96, 46, 43, 2, 66 , 39, 54, 40, 31, 84, 92, 30, 5, 75, 21, 9, 4, 24, 59, 90, 42, 44, 45, 97, 55, 69, 74, 79, 87, 86, 91, 56, 13, 98, 12, 64, 34, 99, 67, 83, 27, 68, 16, 10, 81, 61, 80, 7, 94 , 82, 49, 71, 53, 15, 76, 36, 11, 19, 41, 65, 8, 28, 14, 95, 62, 51, 63, 88, 3, 60, 18, 58, y 52. En el conjunto 7, se utilizaron los genes 90, 80, 39, 46. 51, 91, 25, '16, 3, 36, 20, 30, 17, 99, 95, 44, 27, 89, 61, 9, 65, 19, 86, 13, 84, 14, 5, 10, 82, 67, 85, 45, 59,-81, 35, 41, 4, 71, 32, 24, 22, 6, 53, 98, 54, 66, 42, 18, 97, 94, 87, 49, 79, 56, 72, 57, 76, 69, 28, 43, 23, 11, 52, 92, 7, 93, 96, 75, 73, 8, 58, 83, 50, 29, y 68. En el conjunto 8, se utilizaron los genes 95, 93, 14, 43, 31, 32, 100, 6, 92, 28, 68, 99, 35, - 60, 90, 70, 22, 49, 54, 94, 56, 4, 97, 85, 2, 46, 11, 50, 63, , 38, 76, 39, 58, 64, 67, 83, 33, 88, 79, 87, 40, 57, 27, 55, 18, 3, 29, 82, 53, 98, 91, 61, 80, 26, 84, 20, 77, 86, 51, 1, 74, 23, 19, 10, 21, 47, 69, 24, 66, 81, 96, 15, 36, y 41. En el conjunto 9, se utilizaron los genes 33, 41, 48, 68, 53, 45, 30, 79, 23, 70, 86, 13, 71, 92, 58, 1, 77, 26, 61, 81, 69, 14, 73, 88, 44, 87, 74, 9, 4, 12, 20, 75, 60, 57, 55, 82, 22, 94, 46, 65, 16, 19, 52, 40, 59, 66, 64, 28, 96, 91, 93, 39, 72, 5, 98, 6, 3, 62, 24, 36, 49, 31, 47, 90, 35, 89, 84, 99, 32, 11, 56, 17, 83, 51, y 97. En el conjunto 10, se utilizaron los genes 40, 10, 67, 9, 43, 13, 52, 73, 50, 41, 54, 56, 98, 100, 83, 85, 28, 32, 47, 66, 74, 65, 79, .81, 94, 36, 90, 69, 31, 64 , 88, 99, 44, 18, 33, 75, 95, 42, 58, 92, , 53, 97, 34, 63, 30, 24, 3, 45, 29, 82, 48, 17, 14, 26, 49, 93, 27, 87, 6, 57, 39, 68, 12, 70, 4, 25, 91, 11, 89, 21, 23, 96, 84, y 46. Para 80 genes, conjunto 1, se utilizaron los genes 75, 2, 91, 94, 19, 31, 43, 50, 96, 49, 29, 14, 93, 58, 69, 82, 28, 6, 65, 26, 66, 40, 64, 34, 33, 53, 13, 4, 37, 80, 57, 59, 1, 87, 11, 16, 83, 21, 35, 52, 25, 99, 45, 46, 36, 89, 88,' 7, 39, 55, 90, 72, 17, 9, 85, 44, 22, 56, 8, 23, 18, 77, 12, 10, 48, 97, 61, 74, 92, 81, 95, 68, 47, 71, 62, 24, 70, 20, 79, y 32. En el conjunto 2, se utilizaron los genes 1, 34, 89, 27, 22, 77, 28, 35, 11, 7, 39, 21, 46, 49, 74, 43, 13, 75, 14, 65, 73, 92, 19, 66, 29, 81, 88, 78, 40,- 32, 12, 71, 9, 44, 23, 70, 45, 10, 98, 48, 68, 55, 82, 5, 56, 59, 15, 95, 33, 99, 87, 85, 18, 97, 100, 83, 53, 63, 6, 2, 37, 17, 67, 62, 50, 42, 25, 94, 31, 69, 90, 84, 64, 16, 57, 51, 54, 80, 86, y 38. En el conjunto 3, se utilizaron los genes 63, 28, 35, 67, 96, 9, 12, 31, 1, 59, 22, 44, 11, 82, 6, 64, 87, 47, 21, 94, 42, 2, 72, 19, 20, 27, 89, 13, 77, 3, 16, 79, 38, , 80, 52, 50, 33, 25, 4, 30, 40, 32, 36, 8, 43, 26, 51, 18, 66, 61, 68, 56, 74, 53, 7, 73, 88, 49, 23, 46, 76, 92, 93, 83, 70, 24, 98, 97, 58, 65, 29, 55, 91, 95, 90, 5, 69, 86, y 78. En el conjunto 4, se utilizaron los genes 79, 72, 68, 31, 42, 95, 78, 36, 10, 34, 59, 91, 46, 40, 82, 1, 44, 4, 69, 3, 17, 43, 35, 63, 18, 13, 77, 81, 67, 26, 60, 86, 25, 61, 89, 76, 55, 27, 22, 29, 20, 11, 7, 30, 54, 39, 62, 8, 74, 28, 71, 12, 38, 65, 66, 64, 21, 9, 56, 16, 88, 99, 96, 32, 94, 51, 90, 37, 87, 92, 97, 70, 41, 57, 50, 45, 83, 24, 48, y 58. En el conjunto 5, se utilizaron los genes 1.00, 69, 33, 24, 83, 84, 97, 22, 40, 45, 17, 3, 43, 52, 50, 30, 8, 99, 9, 46, 7, 14, 35, 61, 15, 16, 64, 6, 23, 41, 60, 63, 96, 98, 38, 36, 49, 13, 76, 85, 87, 71, 66, 56, 80, 20, 34, '29, 57, 91, 81, 78, 27, 88, 37, 94, 51, 5, 1, 74, 44, 70, 58, 25, 19, 89, 39, 47, 65, 62, 68, 95, 18, 75, 79, 59, 2, 10, 73, y 53. En el conjunto 6, se utilizaron los genes 69, 100, 3, 35, 58, 56, 96, 43, 39, 50, 61, 36, 71, 95, 30, 18, 90, 63, 21, 31, 94, 46, 44, 23, 7, 10, 88, 49, 9, 53, 25, 54, 2, 97, 82, 75, 68, 48, 26, 91, 70, 65, 51, 19, 84, 29, 47, 12, 99, 85, 20, 16, 5, 22, 73, 93,- 92, 89, 62, 81, 77, 41, 83, 1, 72, 27, 15, 79, 67, 37, 11, 64, 87,- 86, 80, 74, 55, -8, 13, y 60. En el conjunto 7, se utilizaron los genes 67, 73, 85, 95,- 92, 60, 29, 28, 24, 90, 72, 71, 37, 76, 27, 78, 53, 34, 98, 70, 87, 33, 5, 41, 42, 68, 62, 82, 100, 96, 69, 65, 6, 91, 21, 38, 3, 80, 25, 75, 31, 52, 79, 20, 84, 83, 19, 86, 57, 9, 77, 58, 64, 97, 14, 8, 50, 2, 51, 94, 56, 46, 35, 93, 7, 39, 1, 88, 59, 17, 48, 74, 32, 81, 99, 16, 11, 49, 13, y 30. En el conjunto 8, se utilizaron los genes 80, 52, 14, 42, 21, 76, 32, 69, 30, 60, 86, 61, 48, 24, 67, 92, 16, 75, 93, 2, 6, 99, 20, 73, 9, 97, 98, 56, 47, 12, 35, 26, 36, 41„ 96, 55, 11, 84, 7, 87, 4, 70, 79, 88, 44, 17, 50, 27, 89, 28, 29, 43, 77, 39, 8, 15, 91, 65, 22, 71, 53, 37, 34, 95, 83, 45, .68, 1, 18, 13, 31, 85, 3, 90, 51, 49, 19, 66, 63, y 54. En el conjunto 9, se utilizaron los genes 91, 22, 68, 85, 53, 89, 10, 77, 97, 4, 7, 33, 46, 51, 14, 76, 82, 62, 17, 3, 65, 70, 84, 75, 31, 50, 73, 63, 19, 52, 42, 26, 23, 47, 96, 2, 64, 56, 9, 54, 38, 93, 13, 90, 86, 8, 59, 57, 79, 28, 21, 88, 5, 66, 1, 94, 55, 35, 15, 87, 74, 32, 27, 92, 72', 18, 69, 80, 37, 67, 71, 34, 95, 99, 40, 83, 30, 81, 48, y 39. En el conjunto 10, se utilizaron los genes 92, 76, 86, 5, 20, 1, 48, 42, 62, 29, 12, 7, 37, 46, 47, 82, 32, 66, 97, 77, 56, 91, 30, 80, 36, 72, 17, 31, 2, 81, 23, 28, 51, 55, 98, 40, 95, 13, 10, 58, 33, 21, 14, 74, 85, 88, 22, 75, 94, 27, 43, 3, 100, 61, 67, 4, 25, 6, 44, 60, 24, 93, 63, 89, 70, 41, 15, 11, 53, 87, 16, 65, 52, 68, 57, 99, 50, 45, 71, y 38.
Para 85 genes, conjunto 1, se utilizaron los genes 38, 35, 85, 59, 17, 7, 31, 58, 96, 97, 16, 70, 82, 42, 21, 54, 88, 34, 63, 4, 27, 29, 3, 19, 69, 36, 9, 99, 74, 86, 76, 24, 15, 81, 73, 93, 40, 52, 26, 57, 37, 87, 55, 90, 41, 79 45, 77, 91, 71, 61, 11, 94 , 83, 25, 48, 1, 5, 8, 22, 33, 46 60, 56, 20, 44, 89, 18, 10, 23, 78, 65, 50, 72, 75, 47, 98 28, 66, 68, 32, 12, 51, 13, y 100. En el conjunto 2, se utilizaron los genes 32, 90, 94, 21, 77, 63, 17, 27, 62, 41 , 81, 100, 14, 45, 69, 3, 75, 34, 76, 65, 15, 95, 86, 39 92, 89, 24, 57, 4, 54, 50, 58, 88, 5, 56, 22, 59, 6, 52, 28 1, 9, 40, 98, 99, 91, 19, 8, 23, 96, 2, 73, 67, 7, 25, 53 12, 44, 18, 13, 87, 60, 49, 93, 55, 20, 72, 42, 66, 30, 80 33, 26, 64, 46, 84, 31, 70, 61, 71, 83, 38, 36, y 29. En el conjunto 3, se utilizaron los genes 88, 20, 1, 58, 53, 32 65, 34, 50, 75, 71, 36, 59, 39, 30, 61, 8, 62, 14, 3, 94, 66 , 37, 17, 47, 77, 60, 4, 80, 74, 28, 97, 87, 93, 33, 64 48, 29, 18, 49, 21, 56, 69, 22, 25, 43, 54, 91, 7, 81, 79 12, 85, 96, 40, 63, 52, 82, 86, 41, 24, 44, 84, 70, 6, 15 38, 57, 16, 55, 90, 76, 42, 51, 23, 11, 67, 45, 98, 19, 10 27, 2, y 31. En el conjunto 4, se utilizaron los genes 64 86, 54, 83, 47, 21, 67, 57, 73, 23, 71, 76, 56, 9, 44 , 75 82, 11, 8, 99, 72, 13, 79, 28, 92, 5, 27, 90, 24, 91, 33, 68 51, 60, 94 , 58, 78, 48, 18, 42, 53, 98, 70, 32, 41, 49, 45 6, 30, 63, 95, 80, 36, 87, 97, 65, 77, 3, 26, 35, 59, 40, 84 37, 61, 81, 39, 46, 22, 1, 2, 50, 25, 69, 4, 43, 15, 29, 20 17, 88, 10, 38, 100, y 19. En el conjunto 5, se utilizaron los genes 11, 92, 15, 42, 33, 19, 6, 57, 23, 87, 31, 5, 30, 21, 54, 51, 14, 68, 97, 34, 59, 24, 20, 50, 29, 65, 13, 80 16, 73, 8, 25, 47, 55, 27, 45, 100, 96, 85, 38, 37, 81, 44 4, 9, 70, 98, 77, 48, 35, 28, 79, 41, 71, 86, 61, 2, 49, 60 67, 66, 69, 72, 3, 83, 26, 1, 89, 17, 39, 52, 10, 32, 75, ' 82 99, 40, 95, 90, 53, 22, 91, 62, 78, y 56. En el conjunto 6 se utilizaron los genes 87, 32, 4, 63, 15, 81, 92, 10, 74 44, 7, 23, 89, 93, 28, 59, 50, 72, 30, 60, 54, 71, 39, 12 21, 85, 40, 37, 68, 64, 97, 66, 52, 67, 98, 91, 1, 83, 61, 6 24, 38, 86, 77, 26, 88, 43, 100, 48, 20, 14, 31, 82, 9, 13 62, 55, 45, 57, 11, 27, 90, 25, 80, 17, 5, 94, 42, 53, 49 29, 99, 78, 2, 84, 73, 58, 75, 18, 19, 65, 3, 47, 41, y 36 En el conjunto 7_, se utilizaron los genes 56, 38, 23, 74, 34 99, 93, 4, 13, 18, 61, 49, 20, 5, 76, 88, 91, 31, 78, 32, 1 89, 12, 16, 51, 54, 81, 70, 86, 97, 66, 19, 59, 39, 8, 80 73, 35, 71, 77, 24, 53, 68, 33, 62, 69, 43, 41, 15, 94, 44 52, 29, 100, 55, 36, 27, 25, 67, 21, 96, 30, 42, 92, 11, 3 45, 63, 72, 57, 47, 46, 75, 90, 2, 48, 14, 6, 9, 87, 22, 98 95, 84, y 65. En el conjunto 8, se utilizaron los genes 79 64, 71, 18, 37, 40, 54, 34, 26, 65, 39, 67, 14, 62, 95, 11 49, 92, 59, 48, 6, 12, 57, 9, 20, 81, 16, 50, 38, 33, 100 47, 63, 3, 84, 87, 35, 98, 56, 93, 66, 23, 2, 29, 90, 78, 85 60, 19, 72, 97, 36, 13, 94, 25, 45, 41, 27, 69, 52, 8, 68 46, 30, 1, 96, 7, 83, 80, 4, 99, 15, 76, 10, 58, 89, 88, 51, 55, 82, 53, 28, 44, 73, y 77. En el conjunto 9, se utilizaron los genes 35, 85, 81, 4, 20, 88, 66, 74, 13, 36, 6, 24, 95, 97, 2, 21, 90, 57, 89, 42, 73, 79, 64, 59, 46, 68, 92, 67, 82, 28, 56, 14, 65, 99, 39, 38, 8, 62, 61, 78, 11, 48, 93, 91, 29, 33, 76, 16, 69, 47, 84, 94 , 7, 54, 30, 32, 23, 70, 52, 43, 51, 41, 60, 100, 27, 63, 75, 77, 80, 5, 3, 44, 10, 87, 40, 71, 37, 72, 1, 53, 22, 83, 49, 17, y 34. En el conjunto 10, se utilizaron los genes 23, 39, 86, 48, 65, 73, 24, 27, 61, 37, 99, 64, 58, 74, 3, 22, 57, 60, 13, 93, 44, 100, 66, 69, 38, 83, 6, 81, 59, 36, 68, 95, 71, 70, 84, 62, 96, 26, 30, 32, 20, 54, 80, 19, 97, 16, 4, 77, 12, 5, 35, 29, 18, 52, 53, 87, 98, 90, 10, 75, 72, 55, 50, 88, 28, 34, 41, 94, 11, 76, 7, 45, 31, 46, 49, 9, 82, 17, 79, 1, 25, 40, 67, 47, y 85. Para 90 genes, conjunto 1, se utilizaron los genes 79, 5, 27, 100, 96 , 11, 32, 63, 42, 68, 13, 65, 88, 75, 17, 64, 82, 72, 37, 45, 98, 2, 90, 94, 1, 87, 73, 86, 69, 92, 3, , 29, 84, 60, 50, 39, 4, 95, 47, 12, 10, 33, 22, 77, 71, '57, 97, 38, 89, 91, 53, 51, 9, 67, 44, 7, 78, 34, 85, 15, 41, 54, 49, 62, 76, 83, 46, 59, 23, 24, 8, 14, 26, 30, 52, 18, 6, 66, 31, 20, 93, 36, 16, 61, 28, 74, 43, 56, y 48. En el conjunto 2, se utilizaron los genes 95, 28, 46, 62, 91, 99, 53, 65, 66, 60, 22, 29, 50, 2, 93, 33, 54, 57, 92, 24, 9, 4, 69, 5, 8, 58, 88, 43, 6, 100, 51, 18, 16, 45, 81, 44, 68, 14, 59, 82, 63, 73, 30, 86, 98, 13, 84, 94, i, 55, 38, 83, 3, 37, 11, 89, 77, 85, 26, 97, 12, 21, 40, 96, 56, 41, 10, 42, 64, 17, 76, 27, 49, 20, 87, 34, 75, 15, 74, 35, 19, 31, 39, 48, 23, 67, 78, 32, 7, y 80. En el conjunto 3, se utilizaron los genes 88, 89, 6, 94, 17, 60, 8, 76, 45, 90, 47, 80, 15, 85, 51, 5, 46, 36, 65, 4, 25, 67, 78, 77, 97, 23, 11, 40, 61, 53, 39, 12, 38, 21, 59, 55, 32,. 34, 71, 69, 20, 50, 93, 3, 30, 29, 75, 73, 49, 98, 58,' 43, 18, 95, -42, 82, 66, 16, 33, 37, 92, 52, 56, 41, 87, 99, 74, 24, 86, 48, 81, 57, 83, 26, 79, 68, 13, 63, 72, 9, 70, 14, 54, 100, 64, -19, 96, 7, 31, y 2. En el conjunto 4, se utilizaron los genes 19, 33, 41, 40, 70, 51, 14, 48, 42, 12, 90, 4, 32, 60, 89, 64, 45, 86, 73, 16, 50, 5, 9, 72, 81, 3, 27, 87, 76, 58, 29, 31, 13, 21, 55, 18, 6, 62, 56, 96, 47, 63, 37, 98, 28,. 91, 36, 82, 39, 100, 68, 25, 88, 11, 93, 35,. 66, 24, '43, 59, 8, 65, 74, 30, 10, 22, 17, 99, 49, 44, 26, 54, 2, 80, 94, 57, 71, 38, 67, 79, 75, 77, 23, 85, 61, 52, 83, 7, 78, y 53. En el conjunto 5, se utilizaron los genes 49, 55, 13, 97, 59, 83, 61, 34, 80, 19, 12, 65, 86, 72, 89, 25, .39, 77, 82, 47, 22, 48, 20, 11, 23, 84, 31, 4, 54, 91, 8, 87,' 33, 14, 32, 45, 68, 27, 51, 28, 96, 1, 100, 92, 37, 29, 64, 15, 7, 98, 60, 53, 17, 69, 24, 75, 81, 74, 5, 18, 26, 78, 62, 94,' 88, 46, 73, 44, 63, 52, 9, 93, 76, 6, 95, 99, 42, 50, 66, 38, 90, 70, 35, 57, 85, 58, 16, 43, 30, y 10. En el conjunto 6, se utilizaron los genes 81, 52, 60, 16, 18, 40, 67, 47, 5-8, 51, 26, 5, 53, 34, 24, 68, 14, 43, 49, 69, 99, 73, 29, 96, 37, 62, 66, 38, 88, 48,' 11, 50, 79, 74, 15, 39, 83, 57, 94, 95, 100, 12, 84, 10, 33, 3, 93, 91, 17, 46, 59, 86, 7, 9, 71, 19, 22, 80, 27, 97, 4, 75, 89, 21, 78, 85, 63, 61, 77, 31, 32, 56, 6, 72, 92, 55, 76, 90, 36, 35, 98, 1, 82, 25, 23, 44, 65, 64, 28, y 42. En el conjunto 7, se utilizaron los genes 51, 1, 54, 94, 93, 56, 22, 29, 53, 67, 88, 82, 16, 44, 65, 21, 14, 35, 48, 91, 12, 97, 31, 74, 6, 99, 86, 26, 28,' 19, 72, 58, 24, 34, 5, 38, 81, 11, 49, 39, 3, 89, 75, 64, 96, 52, 59, 69, 42, 78, 33, 100, 2, 25, 66, 77, 90, 40, 71, 9, 4, 57, 13, 36, 10, 50, 17, 87, 15, 47, 60, 46, 63, 68, 70, 23, 80, 37, 30, 92, 7, 32, 27, 43, 98, 84, 8, 61, 73, y 41. En el conjunto 8, se utilizaron los genes 53, 63, 17, 43, 6, 44, 95, 58, 78, 13, 3, 15, 28, 41, 12, 93, 2, 92, 23, 42, 62, 57, 33, 8, 65, 49, 80, 81, 50, 71, 74, 39, 4, 70, 77, 51, 84, 21, 30, 36, 46, 75, 47, 94, 16, 67, 55, 1, 26, 52, 60, 19, 59, 90, 96, 14, 87, 37, 40, 66, 88, 73, 29, 10, 5, 56, 100, 45, 31, 34, 22, 64, 91, 54, 48, 25, 98, 61, 18, 72, 69, 27, 68, 99, 83, 35, 24, 82, 85, y 38. En el conjunto 9, se utilizaron los genes 62, 91, 49, 28, 69, 38, 19, 35, 89, 3, 24, 79, 32, 12, 47, 40, 39, 50, 86, 6, 44, 65, 33, 70, 16, 41, 21, 53, 72, 74, 87, 14, 51, 7, 60, 67, 100, 42, 93, 36, 2, 57. 76, 20, 25, 27, 95, 18, 73, 97, 54, 99, 63, 66, 96, 22, 77, 56, 90, 81, 61, 17, 48, 23, 15, 4, 30, 45, 59, 8, 71, 52, 85, 92, 46, 98, 64, 94, 75, 83, 13, 26, 43, 84, 5, 1, 29, 68, 82, y 31. En el conjunto 10, se utilizaron los genes 45, 10, 63, 9, 18, 7, 70, 50, 22, 52, 1. 88, 5, 38, 17, 80, 54, 92, 20, 19, 24, 8, 13, 40, 15, 21, 72, 12, 14, 2, -53, 46, 93, 4, 44, 99, 76, 47, 32, 60, 27, 81, 78, 68, 36, 71, 64, 30, 95, 82, 90, 26, 74, 86, 100, 62, 37, 66, 35, 83, 94, 31, 43, 65, 84, 11, 67, 25, 33, 79, 97, 16, 75, 73, 98, 57, 28, 59, 1, 96, 51, 41, 69-, 3, y 55. Para 95 genes, conjunto 1, se utilizaron los genes 64, 32, 25, 20, 69, 88, 42, 97, 6, 23, 86, 98, 93, 16, 53, 51, 91, 21, 70, 73, 31, 81, 74, 14, 29, 66, 4, 87, 94, 52, 95, 56, 63, 18, 8, 78, 100, 62, 99, 39, 89, 17, 71, 10, 90', 65, 84, 83, 60, 48, 22, 5, 92, 13, 15, 24, 37, 57, 33, 38, 82, 3, 9, 30, 1, 34, 7, 40., 68, 67, 58, 47, 46, 19, 12, 43, 41, 61, 76, "96, 72, 36, 75, 54, 45, 49, 79, y 55. En el .conjunto 2, se utilizaron los genes 44, 39, 62, 1, 19, 61, 33, 84, 36, 91, 21, 53, 30, 63, 92, 45, 11, 87, 10, 82, 96, 64, 8, 32, 42, 78, 69, 59, 72, 48, 66, 15, 27, 49, 75, 40, 47, 57, 52, 31, 95, 97, 26, 5, 93, 34, 60, 81, 88, 29, 23, 67, 76, 6, 98, 37, 74, 100, 20, 18, 12, 13, 51, 41, 54, 14, 2, 68, 99, 3, 38, 77, 50, 4, 17, 22, 9, 83, 71, 85, 25, 79, 46, 86, 7, 73, 65, y 28. En el conjunto 3, se utilizaron los genes 15, 5, 94, 92, 77, 78, 70, 17, 52, 36, 23, 44, 98, 39, 99, 50, 75, 16, 82, 48, 18, 90, 10, 72, 8, 34, 9, 19, 1, 57, 46, 54, 69, 32, 21, 81, 91, 28, 38, 68, 3, 41, 47, 87, 24, 13, 84, 5, 65, 67, 74, 62, 85, 12, 53, 30, 73, 51, 2, 11'9 80, 29, 26, 83, 43, 55, 86, 88, 89, 35,. 66, 31, 96, 100, 58, 60, 14, 6, 61, 49, 22, 20, 27, 7, 64, 37, 45, 97, 95, 40, 71, y 11. En el conjunto 4, se utilizaron los genes 21, 78, 42, 23, 84, 10, 64, 36, 48, 26, 79, 71, 72, 39, 49, 56, 44, 20, 47, 82, 63, 1, 91, 2, 8, 40, 96, 18, 68, .9, 57, 28, 100, 89, 60, 75, 70, 73, 25, 15, 46, 85, 86, 97, 32, 94, 65, 90, 74, 98, 16, 45, 3, 6, 31, 77, 41, 11, 12-, 35, 95, 93, 53, 50, 30, 61, 81, 92, 80, 54, 13, 38, 58, 14, 52, 22, 76, 83, 5, 17, 37, 69, 66, 87, 19, 88, 51, 34, 59, 99, 24, 33, 27, 4, y 62. En el conjunto 5, se utilizaron los genes 29, 34, 28, 58, 89, 1, 73, 30, 92, 76, 68, 33, 38, 8, 49, 3, 42, 9, 40, 36, 43, 81, 97, 59, 7, 79, 54, 15, 11, 61, 18, 82,- 100, 41, 52, 23, 31, 13, 57, 66, 65, 27, 72, 44, 16, 69, 39, 26, 2, 55, 71, 80, 86, 77, 12, 25, 14, 50, 88, 22, 93, 51, 75, 64, 47, 62, 96, 10, 35, 5, 67, 60, 32, 84, 94, 48, 56, 90, 95, 83, 21, 6, 37, 91,* 46, 70, 24, 87, 85, 17, 98, 99, 45, 19, y 63. En el conjunto 6, se utilizaron los genes 36, 34, 46, 2, 5, 77, 91, 59, 61, 29, 9, 85, 52, 16, 17, 60, 51, 95, 69, 58, 57, 23, 82, 33, 18, 45, 43, 49, 90, 1, 94, 93, 47, 37, 35, 63, 27, 96, 32,. 15, 25, 86, 55, 24, 26, 71, 48, 7, 28, 79, 11, 44, 76, 3, 68, 88, 62, 73, 54, 39, 22, 13, 75, 19, 66, 98, 70, 10, 83, 100, 42, 31, 38, 4, 92, 78, 99, 97, 56, 21, 20, 6, 72, 40, 65, 67, 53-, 30, 8, 14, 84, 50, 12, 80, y 81. En el conjunto 7 ,' se utilizaron los genes 26, 7, 14, 64, 91, 50, 8, 48, 23, 29, 34, 28,, 9, 20, 74, 97, 27, 63, 25, 66, 60, 43, 92, 61, 58, 46, 68, 49, 21, 98, 2, 41, 52, 1, 51, 77, 53, 69, 36, 93, 62, 55, 17, 38, 31, 40, 76, 54, 71, 5, 99, 83, 82, 78, 42, 15, 24, 70, 84, 100, 73, 10, 59, 33, 96, 4, 56, 3, 94, 75, 90, 13, 32, 65, 89, 79, 19, 30, 11, 87, 37, 95, 12, 6, 88, 80, 18, 47, 81, 72, 44, 16, 86, 85, y 67. En el conjunto 8, se utilizaron los genes 24, 84, 92, 71, 56, 68, 93, 67, 59, 75, 85, 35, 72, 86, 39, 46, 65, 51, 23, 100, 8, 37, 70, 69, 57, 27, 17, 87, 44, 1, 2, 50, 9, 91, 63, 29, 95, 3, 5, 40, 96, 47, 54, 64, 66, 18, 28, 13, 14, 36, 80, 21, 12, 61, 48, 26, 88, 83, 7, 43, 42, 97, 99, 41, 10, 16, 94, 53, 45, 98, 15, 73, 89, 55, 74, 81, 20, 90, 79, 34, 38, 82, 76, 4, 60, 33, 31, 78, 58, 62, 22, 6, 52, 49, y 19. En el conjunto 9, se utilizaron los genes 99, 77, 10, 92, 24, 43, 41, 15, 46, 78, 38, 19, 2, 5, 3, 81, 82, 22, 56, 63, 47, 90, 33, 34, 75, 100, 62, 65, 13, 30, 95, 98, 94, 25, 67, 11, 6, 66, 14, 48, 93, 4, 21, 89, 35, 68, 97, 45, 27, 59, 76, 85, 42, 49, 23, 40, 37, 74, 26, 52, 8, 91, 53, 57, 58, 86, 31, 20, 9, 16, 84, 69, 96, 44, 32, 54, 60, 7, 51, 83, 72, 28, 29, 61, 80, 55, 64, 17, 18, 70, 50, 1, 12, 73, y 39. En el conjunto 10, se utilizaron los genes 76, 1, 12, 25, 77, 24, 100, 17, 66, 65, 26, 29, 60, 91, 63, 52, 6, 30, 8, 72, 82, 68, 15, 16, 54, 43, 59, 34, 89, 20, 44, 87, 70, 56, 3, 28, 74, 86, 7, 2, 33, 35, 46, 67, 58, 22, 49, 21, 75, 14, 27, 64, 90, 42, 73, 36, 97, 40, 11, 37, 51, 19, 83, 45, 47, 50, 55, 23, 80, 61, 95, 71, 78, 32, 81, 93, 98, 62, 92, 99, 9, 4, 53, 84, 18, 13, 41, 57, 88, 5, 79, 38, 39, 31, y 94. La clasificación de los subconjuntos de los 39 tipos de tumor se realizó con el uso de selecciones aleatorias de tipos de tumor del grupo de 39. Los niveles de expresión de los conjuntos de secuencias de gen-es como es descrito en la presente se utilizaron para clasificar combinaciones aleatorias de tipos de tumor. Diferentes conjuntos aleatorios de tipos de tumor se utilizaron con cada uno de los conjuntos de 100, 74 y 90 secuencias de gen como es descrito en estos ejemplos. Ejemplos representativos y no. limitativos de conjuntos aleatorios de 2 a 20 tipos de tumor se utilizan como sigue, donde el conjunto de 39 tipos de tumor se indexaron de 1 a 39. Para 2 tipos de tumor, el conjunto 1 utilizó los tipos de 26 y 16. El conjunto 2 utilizó los tipos 8 y 5. El conjunto 3 utilizó los tipos 39 y 8. El conjunto 4 utilizó los tipos 27 y 23. El conjunto 5 utilizó los tipos 8 y 19. El conjunto 6 utilizó los tipos 12 y 21. El conjunto 7 utilizó los tipos 30 y 15. El conjunto 8 utilizó los tipos 30 y 5. El conjunto 9 utilizó los tipos 18 y 22. El conjunto 10 utilizó los tipos 27 y 26. Para 4 tipos de tumor, el conjunto 1 utilizó los tipos 20, 35, 15 y 7. El conjunto 2 utilizó los tipos 36, 1, 28 y 19. El conjunto 3 utilizó los tipos 13, 4, 12 y 21. El conjunto 4 utilizó los tipos 12, 33, 14 y 28. El conjunto 5 utilizó los tipos 6, 28, 5 y 37. El conjunto 6 utilizó los tipos 5, 25, 36 y 15. El conjunto 7 utilizó los-tipos 12, 26, 21 y 19. El conjunto 8 utilizó los tipos 19, 3, 20 y 17. El conjunto 9 utilizó los tipos 18, 10, 8 y 9. El conjunto 10 utilizó los tipos 28, 20, 2 y.22. Para 6 tipos de tumor, el conjunto 1 utilizó los tipos 27, 3, 10, 39, 11 y 20. El conjunto 2 utilizó los tipos 33, 10, 20, 32, 13 y 19. El conjunto 3 'utilizó los tipos 31, 27, 18, 39, 8 y 16. El conjunto 4 utilizó los tipos 25, 28, 10, 12, 7 y 39. El conjunto 5 utilizó los tipos 14, 13, 28, 24, 30 y 36. El conjunto 6 utilizó los tipos 9, 24, 8, 17, 36 y 26. El conjunto 7 utilizó los tipos 20, 1, 34, 26, 6 y 19. El conjunto 8 utilizó los tipos 12, 13, 3, 17, 34 y 22. El conjunto 9 utilizó los tipos 7, 1, 17, 13, 20 y 34. El conjunto 10 utilizó los tipos 5, 11, 25, 29, 28 y 35. Para 8 tipos de tumor, el conjunto 1 utilizó los tipos 34, 33, 28, 3, 23, 25, 9- y 29. El conjunto 2 utilizó los tipos 27, -8, 38, 28, 20, 14, 12 y 9. El conjunto 3 utilizó los tipos 29, 21, 19, 1, 13, - 26, 11 y 31. El conjunto 4 utilizó los tipos 25, 17, '7, 20, 34, 8, 28 y 10. El conjunto 5 utilizó los tipos 36, 28, 35, 26, 2, 8, 29 y 7. El conjunto 6 utilizó los tipos 10, 23, 2, 27, 33, 21, 25 y 35.
El conjunto 7 utilizó los tipos 10, 18, 38, 2, 6, 7, 19 y 32. El conjunto 8 utilizó los tipos 11, 37, 6, 28, 3, 9, 2 y 16. El conjunto 9 utilizó los tipos 22, 2, 10, 8, 17, 19 y 33. El conjunto 10 utilizó los tipos 35, 39, 8, 10, 37, 4, 36 y 6. Para 10 tipos de tumor, el conjunto 1 utilizó los tipos .25, 10, 26, 2, 32, 31, 39, 23, 22 y 18. El conjunto 2 •utilizó los tipos 12, 35, 6, 16, 20, 3, 39, 36, 11 y 2. El conjunto 3 utilizó los tipos 34, i, 15, 29, 5, 39, 2, 12, 25 y 18. El conjunto 4 utilizó los tipos 10, 8, 14, 18, 31, 19, 23, 20, 32 y 33. El conjunto 5 utilizó los tipos 10, 18, 37, , 4, 35, 33, 24, 39 y 20. El conjunto 6 utilizó los tipos 22, 16, 4, 3, 18, 21, 1, 25, 37 y 13. El conjunto 7 utilizó los tipos 14, 6, 28, 18, 11, 13, 2, 32, 33 y 19. El conjunto '8 utilizó los tipos 39, 2, 38, 4, 34, 8, 25, 6, 32 y 35. El conjunto .9 utilizó los tipos 3, 10, 11, 16, 6, 15, 18, 14, 12 y 26. El conjunto 10 utilizó los tipos 24, 25, 21, 9, 36, 29, , 39, 10 y 37. Para 12 tipos de tumor, el conjunto 1 .utilizó los tipos 26, 20, 4, 12, 2, 31, 38, 18, 16, 39, 3 y 33. El conjunto 2 utilizó los tipos 25, 16, 4, 9, 29, 27, -14, 24, 21, 7, 23 y 2. El- conjunto 3 utilizó los tipos 31, 18, 23, 13, 25, 1, 29, 21, 35, 10, 32 y 39. El conjunto 4 utilizó los tipos 8, 34, 23, 9, 35, 14, 25, 21, 2, 33, '18 y 28. El conjunto 5 utilizó los tipos 6, 11, 21, 8, 5, 7, 19, 32, 3, 13, 36 y 9. El conjunto 6 utilizó los tipos 12, 33, 14, 26, 27, 15, 2, 21, 36, 35, 9 y 39. El conjunto 7 utilizó los tipos 26, 29, 32, 17, 31, 19, 6, 5, 20, 34, 2 y 24. El conjunto 8 utilizó los tipos 17, 12, 8, 22, 28, 9, 27, 29, 14, 35, 4 y 32. El conjunto 9 utilizó los tipos 29, 9, 36, 23, 33, 18, 21, 35, 3, 6, 2 y 1. El conjunto 10 utilizó los tipos 1, 3, 35, 29, 22, 27, 8, 23, 2, 36, 14 y 19. Para 14 tipos de tumor, el conjunto 1 utilizó los tipos 9, 26, 38, 25, 31, 3, 15, 14, 17, 33, 12, 35, 39 y 16.
El conjunto 2 utilizó los tipos 1, 26, 16, 25, 20, 12, 14, 37, 38, 24, 23, 33, 27 y 35. El conjunto 3 utilizó los tipos 11, 21, 35, 38, 32, 34,. 27, 39, 16, 15, 4, 5, 13 y 18. El conjunto 4 utilizó los tipos 27, 5, 13, 28, 18, 17, 15, 20, 29, 37, 21, 36, 25 y 14. El conjunto 5 utilizó los tipos 5, 12, 17, 9, 25, 21, 33 , 37, 8, 15, 24, 3, 34 y 28. El conjunto 6 utilizó los tipos 11, 19, 34, 26, 9, 6, 32, 14, 27, 29, 30, 16, 24 y 17. El conjunto 7 utilizó los tipos 31, 26, 11, 18, 19, 20, 9, 8, 5, 36, 12, 6, 27 y 38. El conjunto 8 utilizó los tipos 20, 17, .11, 5, 15, 9, 2, .39, 34, 24, 27, 26, 35 y 10. El conjunto 9 utilizó los tipos 1, 14, 39, 30, 17, 6, 10, 35, 31, 33, 15, 29, 32 y 7. El conjunto 10 utilizó los tipos 1, 19, 24, 28, 34, 12, 13, 18, 32, 11, 14, 21, 22 y 25. Para 16 tipos de tumor, el conjunto 1 utilizó los tipos 27, 15, 8, 12, 6, 20, 26, 19, 25, 2, 37, 38, 7, 39, 4 y 33. El conjunto 2 utilizó los tipos 17, 18, 28, 5, 6, 31, 25, 13, 8, 20, 37, 36, 35, 9, 23 y 27. El conjunto 3 utilizó los tipos 23, 37, 34, 14, 16, 27, 32, 33, 21, 38, 4, 30, 24, 22, 17 y 25. El conjunto 4 utilizó los tipos 7, 37, 38, 21, 34, 31, 32, 2.5, 10, 36, 19, 11, 6, 26, 18 y 35. El conjunto 5 utilizó los tipos 9, 32, 12, 24, 20, 13, 38, 21, 39, 23, 36, 18, 37, 22, 5 y 3. El conjunto 6 utilizó los tipos 14, 2-1, 5, 17, 6, 20, 18, 35, 22, 10, 3, 23, 13, 2, 34 y 26. El conjunto 7 utilizó los tipos 1, 8, 19, 6, 9, 39, 28, 18, 13, 31, 14, 16, 37, 12, 3 y 25. El conjunto 8 utilizó los tipos 32, 36, 28, 38, 9, 33, 2, 5, 4, 11, 19, 18, 13, 8, 12 y 3. El conjunto 9 utilizó los tipos 9, 14, 10, 5, 28, 32, 23, 6, 39, 3, 17, 8, 19, 1, 31 y 12. El conjunto 10 utilizó los tipos 4, 34, 11, 6, 38, 19, 7, 20, 23, 3, 25, 37, 26, 1, 15 y 12. Para 18 tipos de tumor, el conjunto 1 utilizó los tipos 15, 24, 39, 35, 7, 30, 16, 13, 20, 3, 26, 4, 12, 10, 34, 25, 21 y 28. El conjunto 2 utilizó los tipos 21, 23, 29, 11, 10, 19, 13, 28, 4, 20, 17, 24, 30, 12, 39, 34, 31 y 9. El conjunto 3 utilizó los tipos 7, 17, 27, 6, 30, 8, 22, 2, 32, 26, 21, 14, 4, 38, 1, 35, 16 y 28. El conjunto 4 utilizó los tipos 17, 13, 20, 33, 10, 3, 16, 22, 1, 38, 2, 9, 28, 5, 6, 19, 12 y 11. El conjunto 5 utilizó los tipos 4, 35, 21, 25, 18, 17, 8, 14, 31, 30, 9, 1, 2, 23, 36, 29, 32 y 37. El conjunto 6 utilizó los tipos 17, 34, 2, 18, 19, 15, 16, 13, 4, 24, 5, 35, 6, 22, 28, 37, 38 y 1. El conjunto 7 utilizó los tipos 34, 26, 12, 25, 27, 3, 17, 7, 2, 32, 9, 36, 21, 19, 22, 8, 20 y 29. El conjunto 8 utilizó los tipos 12, 34, 38, 25, 17, 22, 14, 39, 10, 7, 31, 2, 3, 11, 29, 30, 16 y 24. El conjunto 9 utilizó los tipos 13, 26, 27, 14, 5, 10, 8, 7, 16, 30, 37, 4, 6, 35, 28, 1, 36 y 20. El conjunto 10 utilizó los tipos 15, 2, 17, 23, 26, 28, 36, 38, 12, 6, 19, 37, 20, 14, 9, 39, 11 y 21. Para 20 tipos de tumor, el conjunto 1 utilizó los tipos 25, 13, 21, 15, 37, 20, 12, 28, 9, 10, 26, 22, 14, 24, 16, 7, 39, 34, 33 y 4. El conjunto 2 utilizó los tipos 20, 17, 10, 27, 19, 28, 5, 1, 23, 21, 38, 7, 13, 22, 32, 31, 9, 4, 3 y 24. El conjunto 3 utilizó los tipos 17, 13, 7, 20, 11, 38, 34, 3, 15, 12, 5, 39, 9, 10, 4, 35, 27, 6, 21 y 33. El conjunto 4 utilizó los tipos 6, 13, 17, 26, 1, 7, 33, 5, 10, 32, 3, 23, 35, 4, 14, 28, 12, 38, 8 y 27. El conjunto 5 utilizó los tipos 10, 23, 9, 38, 5, 29, 12, 27, 25, 6, 7, 26, 37, 31, 24, 36, 19, 15, 16 y 11. El conjunto 6 utilizó los tipos 30, 24, 21, 11, 23, 25, 8, 9, 7, 31, 27, 5, 14, 29, 1, 19, 16, 12, 22 y 17. El conjunto 7 utilizó los tipos 26, 13, 23, 19, 22, 11, 25, 21, 33, 20, 6, 17, 2, 10, 31, 34, 27, 37, 7 y 9. El conjunto 8 utilizó los tipos 30, 1, 38, 7, 31, 37, 11, 25, 6, 19, 28, 33, 17, 29, 10, 27, 16, 3, 14 y 15. El conjunto 9 utilizó los tipos 15, 19, 26, 24, 5, 33, 11, 2, 13, 18, 31, 22, 32, 20, 23, 6, 10, 25, 36 y 3. El conjunto 10 utilizó los tipos 24, 25, 21, 29, 14, 18, 31, 2, 20, 39, 23, 9, 38, 12, 6, 32, 22, 26, 33 y 7. Ejemplo 4: Conjuntos de genes especificados Un primer • conjunto de 74 genes y un segundo conjunto de 90 genes, donde los dos conjuntos tienen 38 miembros en común, se utilizaron en la práctica de 1 invención. El desempeño de dos conjuntos contra los números variantes de tipos de tumor se muestra en la Figura 3. Subconjuntos aleatorios de 50 a todos los miembros del conjunto de 74 secuencias de gen expresadas se evaluaron de una manera análoga a aquella descrita en el Ejemplo 3. Nuevamente, los niveles de expresión de las combinaciones aleatorias de 50, 55, 60, 65, 70 y todos los 74 (cada combinación muestreada 10 veces) de las 74 secuencias expresadas se utilizaron con datos de los tipos de tumor y luego se utilizaron para predecir los conjuntos aleatorios de prueba de las muestras de tumor (cada una muestreada 10 veces) que varían de 2 a todos los 39 tipos. Los datos resultantes se muestran en las Figuras 4 y 5. Los miembros de las 74 secuencias de gen se indexaron de 1 a 74, y los conjuntos aleatorios representativos utilizados en la invención son como sigue: Para 50 genes, conjunto 1, se utilizaron los genes 69, 64, 74, 29, 4, 5.7, 30, 72, 36, 59, 42, 47, 11, 33, 60, , 39, 10, 50, 49, 41, 12, 34, 51, 32, 66, 71, 37, 13, 14, 8, 25, 53, 21, 68, 7, 67, 55, 27, 22, 1, 44, 46, 28, 48, 19, 73, 23, 16, y 3. En el conjunto 2, se utilizaron los genes 60, 61, 23, 17, 10, 31, 16, 8, 72, 73, 18, 49, 71, 46, 29, 21, 66, 39, 22, 27, 43, 30, 51, 3, 38, 19, 37, 35, 70, 54, 40, 2, 55, 28, 45, 33, 25, 14, 48, 20, 36, 47, 62, 9, 69, 68, 53, 58, 15, y 7.. En el conjunto 3, se utilizaron los genes 53, 68, 31, 2, 62, 17, 49, 71, 6, 56, 3, 66, 23, 21 ,33, 30, 45, 73, 74, 11, 58, 27, 64, 18, 72, 42, 7, 28, 34, 43, 38, 65, 12, 47, 16, 40, 41, 36, 54, 61, 19, 63, 25, 46, 59, 9, 39, 55, 22, y 48. En el conjunto 4, se utilizaron los genes 23, 70, 48, 1, 11, 25, 60, 26, 5, 58, 46, 39, 28, 71, 35, 34, 2, 59, 69, 55, 49, 40, 15, 14, 68, 57, 10, 31, 67, 74, 62, 44 , 16, 12, 64, 63, 61, 13, 52, 45, 19, 50, 36, 33, 9, 24, 32, 29, 56, y 72. En el conjunto 5, se utilizaron los genes , 26, 10, 34, 67, 73, 15, 59, 3, 64, 14, 70, 23, 47, 72, 71, 44', 49 , 31, 48, 5, 61, 53, 20, 33, 58, 37, 50, 43, 18, 21, 38, 29, 16, 12, 63, 39, 4, 45, 60, 69, 25, 24, 65, 55, 13, 36, 11, 17, y 22. En el conjunto 6, se utilizaron los genes 43, 34, 61, 19, 35, 56, 24, 3, 23, 15, 13, 69, 1, 67, 42, 41, 64, 25, 63, 28, 8, 53, 38, 71, 6, 36, 68, 14, 18, 65, 51, 33, 4, 60, 5, 22, 40, 30, 50, 37, 29, 17, 27, 11, 9, 66, 62, 57,- 59, y 10. En el conjunto 7, se utilizaron los genes 51, 55, 46, 31, 21, 72, 8, 67, 56, 1, 64, 6, 63, 32, 20, 16, , 61, 2, 45, 35, 22, 66, 38, 36, 3, 34, 27, 74, 47, 54, 30, 14, 13, 37, 23, 19, 12, 59, 18,' 52, 5, 17, 33, 7, 39, 43, 58, 41, y 10. En el conjunto 8, se utilizaron los genes 28, 68, 71, 46, 48, 47, 5, 23, 22, 35, 60, 3, 40, 33, 41, 72, 12, 24, , 37, 1, 20, 45, 53, 61, 65, 74, 4, 10, 51, 26, 30, 38, 44, 55, 73, 66, 6, 39, 52, 36, 2, 59, 67, 27, 43, 50, 18, 8, y 69. En el conjunto 9, se utilizaron los genes 73, 51, 67, 63, 24, 55, 42, 61, 13, 29, 23, 64, 49, 53, 19, 2, -43, 11, 15, 31, 58, 40, 38, 46, 44, 4, 27, 41, 28, 69, 8, 26, 5, 68, 37, 70, 25, 62, 22, 52, 1, 57, 54, 34, 16, 71, 9, 65, 14, y 30. En el conjunto 10, se utilizaron los genes 9, 13, 46, 2, 62, 47, 50, 36, 58, 23, 55, 31, 6, 40, 32, 27, 35, 33, 39, 1, 22, 19, 65, 16, 52, 72, 30, 3, 12, 7, 74, 21, 54, 20, 41, 10, 28, 37, 24, 53, 69, 11, 14, 67, 25, 71, 15, 42, 18, y 73. Para 55 genes, conjunto 1, se utilizaron los genes 19, 3, 26, 44, 16, 59, 11, 39, 46, 54, 22, 7, 60, 30, 72, 6, 74, 53, 57, 14, 43, 47, 27, 45, 37, 24, 33, 64, 21, 36, 20, 50, 68, 62, 63, 17, 61, 10, 70, 18, 25, 71, 29, 65, 51, 56, 58, 69 , 5, 55, 12, 1, 40, 49, y 13. En el conjunto 2, se utilizaron los genes 35, 15, 11, 33, 5, 29, 73, 69, 31, 70, 10, 45, 41, 72, "74, 26, 32, 12, 30, 34, 16, 64, 13, 50, 46, 38, 18, 48, 37, 68, 40, 61, 62, 6, 63, 47, 36, 65, 17, 67, 71, 39, 4, 59, 22, 24, 8, 9, 58, 3, 52, 20, 14, 25, y 7. En el conjunto 3, se utilizaron los genes 7, 19, 50, 62, 47, 74, 22, 26, 3 , 8, 41, 53, 52, 67, 16, 40, 54, 34, 30, 46, 25, 55, 31, 3, 69, 38, 29, 65, 45, 43, 51, 68, 18, 57, 21, 5, 32, , 27, 73, 66, 10, 49, 24, 12, 13, 11, 71, 60, 23, 63, 35, 48, 39, y ^0. En el conjunto 4, se utilizaron los genes 58, 70, 43, 68, 39, 57, 71, 27, 21, 53, 16, 23, 25, 60, 40, 36, 2, 63 , 33, 49, 5, 54, 32, 66, 50, 59, 14, 52, 15, 48, 45, 44, 19, 72, 26, 10, 6, 41, 34, 61, 42, 67, 17, 24, 8, 11, 29, 74, 3, 51, 47, 65, 69, 28, y 1. En el conjunto 5, se utilizaron los genes 60, 53, 21, 63, 7, 19, 69, 3, 9, 22, 10, 50, 59, 71, 20, 11, 70, 6, 4, 17, 58, 16-, 40, 68, 73, 38, 18, 15, 57, 26, 34, 67, 41, 27, 49, 28, 46, 54, 1, 13, 31, 48, 32, 61, 42, 66, 29, 5, 55, 72, 25, 30, 39, 44, y 56. En el conjunto 6, se utilizaron los genes 4, 36, 17, 47, 16, 6, 14, 51, 65, 42, 31, 38, 26, 15, 70, 28, 41, 72, 30, 3, 29, 55, 34, 32, 54, 24, 48, 39, 22, 57, 37, 23, 71, 61, 50, 21, 27, 53, 25, 40, 20, 69, 58, 66, 46, 1, 43, 12, 33, 63, 18, 68, 10, 56, y 45. En el conjunto 7, se utilizaron los genes 71, 7, 38, 61, 22, 33, 51, 25, 68, 6, 1, 49, 9, 58, 18, 55, 5, .50, 65, 52, 26, 59, 35, 11, 15, 70, 54, 27, 60, 28, 19, 63, 21, 10, 32, 42, 73, 36, 45, 66, 47, 2, 56, 23, 64, 44, 34, 29, 48, 69, 37, 16, 74, 53, y 43. En el conjunto, 8 se utilizaron los "genes 25, 42, 70, 28, 6, 48, 43, 20, 60, 18, 56, 74, 27, 9, 55, 67, 58, 68, 39, 38, 29, 1, 21, 45, 44, 66, 53, 34, 47, 64 41, 57, 10, 3, 31, 65, 54, 46, 50, 59, 23, 73, 24, 51, 36, 26, 16, 49, 37, 62, 7, 32, 19, 22, y 14. En el conjunto 9, se utilizaron los genes 49, 65, 20, 59, 21, 45, 54, 29, 51, 50, 17, 37, 55, 47, 57, 9, 8, 18, 11, 10, 25, 1, 30, 68, 5, 6, 74, 70, 60, 53, 48, 39, 4, 23, 27, 73, 35, 40, 41, 44, 24, 3, 58, 19, 14, 13, 33, 63, 62, 46, 2, 12, 72, 36, y 7. En el conjunto 10, se utilizaron los genes 73, 53, 26, 24, 58, 25, 59, 71, 34, 65, 46, 2, 57, 48, 68, 21, 44, 22, 16, 70, 60, 8, 66, 45, 14, 27, 43, 37, 20, 36, 72, 18, 56, 4, 7, 6, 23, 15, 74, 1, 9, 50, 5, 35, 40, 32, 12, 38, 69, 33, 61, 62, 10, 47, y 39.
Para 60 genes, conjunto 1, se utilizaron los genes 49, 60, 66, 26, 22, 53, 33, 56, 10, 44, 17, 36, 41, 6, 21, 57, 39, 65, 24, 30, 31, 15, 43, 68, 64, 59, 28, 73, 13, 18, 51, 34, 63, 40, 71, 58, 48, 11, 37, 42, 70, 45, 72, 3, 67, 35, 52, 46, 32, 55, 27, 38, 19, 25, 5, 69, 62, 14, 23, y 4. En el conjunto 2, se utilizaron los genes 57, 5, 31, 15, 20, 54, 21, 42, 71, 50, 17, 68, 61, 53, 9, 35, 67, 12, 14, 52, 41, 38, 22, 45, 32, 39, 70, 18, 6, 26, 59, 40, 25, 28, 56, 10, 3, 47, 34, 8, 60, 2, 9, 62, 66, 19, 11, 37, 27, 36, 69, 7, 65, 4, 33, 24, 51, 55, 48, y 44. En el conjunto ,3 , se utilizaron los genes 37, 54, 44, 66, 36, 1, 61, 62, 47, 69, 4, 30, 31, 11, 8, 63, 38, 16, 65, 25, 74, 21, 34, 60, 20, 71, 12, 19, 43, 15, 27, 57, 6, 55, 64, 22, 14, 39, 53, 23, 17, 28, 51, 56, 40, 29, 58, 48, 42, 59, 68, 5, 35, 50, 72, 10, 45, 32, 33, y 73. En el conjunto 4, se utilizaron los genes 24, 2, 49, 57, 35, 45, 40, 51, 42, 7, 47, 5, 8, 17, 61, 74, 64, 72, 50, 60, 70, 26, 9, 56, 32, 4, 16, 44, 27, 43, 53,' 33, 46, 55, 41, 68, 48, 11, 10, 39, 19, 6, 3, 14, 65, 69, 30, 34, 29, 36, 58, 28, 1, 23, 73, 15, 25, 13, 54, y 18. En el conjunto 5, se utilizaron los genes 18, 28, 1, 22, 71, 37, 62, 46, 31, 25, 70, 64, 66, 35, 5, 60, 10, 26, 9, 43, 67, 20, 59, 51, 33, 42, 3, 24, 49, 13, 27, 38, 61, 14, 52, 63, 11, 74, 7, 16, 23, 72, 39, 73, 15, 6, 17, 30, 57, 8, 50, 48, 34, 53, 2, 69, 29, 56, 44, y 47. En el conjunto 6, se utilizaron los genes 33, 74, 12, 7, 49, 25, 38, 1, 8, 4, 48, 26, 58, 54, 21, 50, 72, 45, 62, 66, 36, 13, 42, 5, 39, 17, 28, 23, 67, 41, 29, 73, 19, 56, 51, 69, 10, 16, 55, 14, 24, 64, 22, 59, 52, 35, 2, 31, 3, 9, 27, 71, 30, 32, 53, 11, 40, 61, 15, y 70. En el conjunto 7, se utilizaron los genes 30, 65, 26, 48, 47, 20, 17, 56, 35, 32, 10, 11, 1, 59, 50, 53, 45, 13, 63, 49, 41, 74, 16, 57, 15, 64, 12, 54, 5, 8, 67, 69, 31, 14, 61, 60, 37, 66, 43, 71, 23, 36, 51, 44, 34, 2, 42, 19, 58, 25, 27, 68, 18, 52, 21, 7, 70, 22, 28, y 62. En el conjunto 8, se utilizaron los genes 12, 58, 11, 5, 72, 70, 63, 66, 49, 44, 14, 48, 26, 73, 51, 47, 13, 65, 1, 39, 61, 17, 40, 8, 24, 54, 42, 34, 64, 21, 53, 59, 46, 4, 20, 29, 57, 74, 31, 67, 6, 69, 7, 63, 41, 3, 18, 62, 19, 32, 10, 43, 36, 71, 28, 60, 30, 15, 23, y 52. En el conjunto 9, se utilizaron los genes 7, 20, 69, 12, 58, 40, 70, 57, 3, 37, 6, 16, 61, 11, 13, 31, 55, 17, 49, 22, 36, 47, 44, 18, 45, 68, 25, 72, 19, 14, 39, 46, 30, 59, 56, 5, 66, 2, 41, 51, 9, 54, 35, 15, 26, 27, 23, 65, 4, 63, 1, 60, 21, 74, 24, 43, 38, 64, 50, y 67. En el conjunto , se utilizaron los genes 5, 43, 54, 22, 49, 48, 25, 24, 52, 35, 14, 70, 26, 72, 59, 71, 9, 41, 74, 36, 17, 47, 29, 34, 20, 27, 65, 68, 3, 73, 45, 62, 57, 56, 53, 44, 6, 7, 31, 55, 30, 23, 15, 33, 38, 42, 10, 60, 66, 8, 1, 64, 19, 16, 12, 61, 63, 51, 18, y 2. Para 65 genes, conjunto 1, se utilizaron los genes 11, 10, 1, 69, 43, 33, 54, 24, 39, 27, 42, 18, 9, 46, 12, 20, 61, 44, 51, 64, 35, 8, 36, 38, 21, 7, 57, 59, 23, 49, 17, 15, 22, 55, 29, 16, 37, 72, 30, 31, 45, 63, 40, 28, 41, 32, 66", 65, 5, 47, 53, 60, 25, 50, 74, 52, 14, 68, 48, 13, 2, 4, 3, 6, y 67. En el conjunto 2, se utilizaron los genes 37, 8, 31, 4, 23, 57, 69, 40, 3, 9, 5, 32, 42, 44, 56, 21, 10, 34, 74, 61, 39, 38, 13, 70, 41, 19, 48, 47, 29, 52, 26,- 72, 49, 45, 7, 63, 16, 25, 24, 14, 18, 60, 59, 11, 35, 2, 30, 68, 58, 67, 27, 33, 66, 12, 71, 51, 55, 6, 20, 54, 1, 46, 64, 62, y 53. Én el conjunto 3, se utilizaron los genes 24, 19, 35, 57 27, 8, 23, 30, 65, 32, 59, 2.9, 4, 47, 17, 53, 34, 54, 73, 14, 20, 63, 43, 3, 38, 61, 31, 49, 25, 42, 41, 51, 18, 7, 40, 39, 33, 50, 70, 28, 13, 74, 36, 45, 64, 5, 16, 58, 1, 66, 62, 46, 15, 12, 72, 21, 2, 68, 71, 9, 44, 26, 37, 6, y 55. En el conjunto 4, se utilizaron los genes 62, 29, 5, 41, 18, 4, 21, 63, 65, 8, 55, 61, 66, 34, 23, 28, 14, 49, 68, 15, 1, 11, 19, 73, 13, 57, 20, 27, 50, 2, 72, 22, 6, 7, 40, 67, 51, 45, 10, 36, 53, 64, 54, 24, 25, 37, 74, 12, 52, 26, 38, 32, 3, 30, 33, 39, 48, 58, 17, 42, 71, 43, 69, 56, y 9. En el conjunto 5, se utilizaron los genes 49, -58, 74, 65, 67, 44, 57, 28, 56, 18, 59, 31, 10, 17, 41, 39, 63, 7, 21, 55, 38, 2, 51, 42, 5, 53, 20, 34, 16, 43, 19, 15, 50, 4, 6, 11, 52, 37, 8, 64, 69, 12, 48, 60, 1, 66, 27, 36, 45, 30, 14, 72, 68, 73, 35, 47, 71, 22, 70, 33, 32, 46, 25, 13,' y 54. En el conjunto 6, se utilizaron los genes 7, 44 , 23, 68, 46, 30 , 10, 4, 3, 53, 22, 38, 50, 26, 55, 49, 20, 11, 73, 12, 62, 63, 43, 69, 6, 61, 52, 25, 65, 16, 47, 34, 33, 28, 42, 58, 29, 39, 31, 1, 36, 13, 5, 60, 35, 19, 40, 18, 59, 64, 41, 70, 72, 57, 67, 9, 74, 8, 14, 71, 45, 56, 32, 51, y 2. En el conjunto 7, se utilizaron los genes 57, 61, 9, 48, 31, 4-, 40, 35, 1, 16, 44, 67, 68, 34, 6, 64, 7, 54, 53, 10, 18, 39, 23, 14, 33, 74, 51, 38, 24, 19, 72/63, 36, 65, 32, 2, 27, 45, 3, 43, 21, 49, 30, 60, 50, 70, 41, 20, 11, .37, 13, 15, 5, 12, 46, 26, 22, 71, 8, 62, 29, 28, 25, 17, y 52. En el conjunto 8, se utilizaron los genes 11, 21, 3, 6, 74, 58, 52, 40, 17, 23, 41, 63, 22, 56, 55, 8, 60, 54, 51," 57, 66, 68, 29, 24, 69, 39, 16, 49, 72, 59, 48, 61, 2, 7, 44, 37, 43, 45, 35, 25, 1, 4, 20, 14, 36, 42, 65, 62, 71, 32, 19, 70, 28, 27, 9, 46, 33, 18, 67, 15, , 26, 12, 47, y 53. En ei conjunto 9, se utilizaron los genes 48, 27, 64, 55, 30, 2, 33, 16, 31, 21, 57, 50, 63, 17, 44, 29, 4, 6, 60, 65, 23, 19, 58, 68, 25, 59, 14, 7, 42, 12, 69, 45, 53, 73, 56, 34, 41, 3, 18, 5, 72, 70, 40, 37, 62, 43, 51, 24, 52, 20, 39, ' 8, 13, 26, 10, 66, 54, 22,- 49, 61, 11, 46, 32 67, y 36. En el conjunto 10, se utilizaron los genes 31, 39, 50, 60, 17, 33, 73, 30, 3, 27, 10, 62, 29, 12, 59, 1, 34, 69, 51, 72, 65, 52, 16, 36, 28, 23, 42, 40, 66, 58, 48, 46, 38, 74, 20, 55, 21, 49, 6.3, 2, 70, 7, 26, 53, 41, 45, 25, 44, 71, 32, 24, 13, 14, 6, 57, 11, 68, 35, 54, 22, 64, 8, 9, 56, y 37. Para 70 genes, conjunto 1, se utilizaron los genes 72, 74, 31, 73, 52, 16, 32, 24, 14, 66, 59, 28, 54, 1, 11, 12, 34, 57, 5, 67, 25, 42, 62, 71, 68, 6'9, 48, 7, 18, 20, 47, 19, 53, 2, 4, 15, 26, 63, 37, 17, 10, 60, 65, 8, 22, 70, 36, , 41, 9, 21, 35, 49, 38, 33, 56, 46, 27, 45, 44, 39, 43, 29, 50, 61, 40, 23, 64, 55, y 3. En el conjunto 2, se utilizaron los genes 45, 32, 60, 2, 42, 56, 8, 46, 30, 27, 17, 62, 26, 24, 65, 49, 16, 70, 3, 47, 50, 4, 40, 28, 1, 36, 22, 59, 48, 9, 57, 5, 72, 23, 13, 44, 67, 14, 12, 34, 21, 41, 71, 39, 66, 25, 69, 19, 15, 6, 68, 29, 52, 43, 64, 58, 54, 11, 37, 38, 55, 7, 20, 61, 53, 63, 10, 74, 51, y 35. En el conjunto 3, se utilizaron los genes 66, 71, 40, 62, 60, 51, 61, 5, 19, 15, 34, 13, 18, 8, 28, 59, 35, 54, 2, 55, 29, 22, 41, 37, 45, 64, 48, 7, 73, 27, 30, 69, 63, 23, 25, 42, 1, 24, 14, 38, 4, 70, 53, 3, 36, 12, 74, 68, 26, 57, 33, 17, 67, 72, 52, 58, 46, 39, 43, 56, 65, 10, 44, 11, 20, 47, 50, 9, 21, y 49. En el conjunto 4, se utilizaron los genes 73, 26, 33, 40, 71, 50, 62, 59, 10, 39, 64, 68, 3, 1, 44, 9, 72, 57, 43, 37, 24, 65, 48, 6, 11, 23, 36, 19, 7, 31, 67, 69, 38, 29, 16, 35, 63, 21, 46, 15, 47, 28, 2, 5, 52, 70, 14, 22, 56, 45, 17, 4, , 66, 13, 55, 20, 30, 32, 54, 51, 49, 58, 74, 42, 53, 61, 34, 12, y 60. En el conjunto 5, se utilizaron los genes 7, 1, 24, 70, 26, 35, 68, 71, 74, 33, 5, 20, 49, 27, 65, 10, 72, 21, 66, 12, 4, 43, 9, 55, 23, 56, 47, 31, 42, 59, 61, 45, 67, 13, 63, 58, 17, 54, 28, 3, 64, 53, 39, 36, 30, 40, 37, 16, 41, 11, 52, 14, 62, 8, 46, 25, 44, 69, 29, 48, 51, 22, 73, 57, 18, 15, 19, 38, 6, y 50. En el conjunto 6, se utilizaron los genes 41, 36, 1, 27, 9, 51, 4, 38, 8, 25, 73, 5, 7, 22, 68, 30, 6, 33, 65, 70, 21, 26, 60, 62, 63, 54, 57, 74, 58, 44, 11, 31, 53, 34, 10, 48, 23, 3, 42, 35, 49, 13, 71, 17, 50, 28, 19, 20, 40, 64, 56, 43, 69, 59, 39, 66, 72, 46, 32, 2, 14, 47, 52, 45, 15, 37, 12, 16, 24, y 67. En el conjunto 7, se utilizaron los genes 39, 70, 16, 5, 43, 6, 36, 30, 9 53, 2, 34, 72, 42, 64, 73, 56, 63, 38, 13, 19, 27, 29, 60 37, 52, 1, 3, 21, 22, 68, 69, 26, 55, 61, 11, 18, 12, 45, 8 51, 65, 32, 33, 67, 48, 50, 10, 20, 28, 58, 7, 49, 35, 57 71, 23, 17, 24, 62, 59, 54, 15, 40, 14, 41, 47, 46, 44, y 4 En el conjunto 8, se utilizaron los genes 3, 5, 50, 35, 53 57, 14, 49, 55, 8, 25, 22, 71, 60, 13, 19, 12, 32, 26, 44 , 39, 17, 31, 61, 23, 66, 68, 4, 6, 7, 41, 24, 40, 58, 67 46, 70, 45, 64, 51, 69, 18, 62, 47, 52, 11, 30, 73, 28, 33 2, 36, 1, 72, 42, 20, 27 , 10, 16, 63, 38, 59, 74, 43, 9, 56 34, 21, y 65. En el conjunto 9, se utilizaron los genes 18 49, 70, 46, 29, 9, 52, 53, 64, 28, 37, 27, 7, 57, 44, 19, 72 61, 67, 30, 62, 47, 2, 39, 8, 65, 26, 14, 63, 4, 20, 59, 45 , 10, 3, 16, 58, 25, 38, 60 , 71, 66, 32, 23, 55, 69, 12 33, 6, 42, 36, 22, 48, 24, 68, 41, 17, 54, 13, 21, 51, 73 74, 40, 43, 1, 11, 56, y 35. En el conjunto 10, se utilizaron los genes 14, 12, 65, 74, 58, 6, 36, 5, 34, 11, 18, 33, 32, 7, 22, 37, 64, 59, 9, 52, 41, 26, 3, 19, 48, 35, 56, 62, 42, 60, 1, 8, 43, 50, 25, 61, 54, 49, 20, 70, 44, 30, 15, 46, 72, 38, 4, 29, 68, 21, 39, 17, 16, 53, 45, 73, 63, 31, 55, 47, 24, 69, 2, 71, 13, 28, 66, 23, 57, y 40.
Un experimento similar se realizó con los subconjuntos aleatorios de 50 a todos los miembros del conjunto de 90 secuencias de gen expresadas. Nuevamente, los niveles de expresión de las combinaciones aleatorias de 50, 55, 60 , 65, 70 y todos los 90 (cada combinación muestreada 10 veces) de las 90 secuencias expresadas se utilizaron con datos de tipos de tumor y luego se utilizaron para predecir los conjuntos aleatorios de prueba de muestras de tumor (cada una muestreada 10 veces) que varía de 2 a todos los 39 tipos. Los datos resultantes se muestran en las Figuras 6 y 7. Los miembros de las 90 secuencias de gen se indexaron de 1 a 90, y conjuntos aleatorios representativos utilizados en la invención son como sigue: Para 50 genes, conjunto 1, se utilizaron los genes 89, 30, 62, 23, 31, 20, 53, 25, 15, 38, 11, 22, 68,' 44, 58, 7, 14, 61, 67, 32, 18, 71, 9, 54, 46 , 3, 57, 50, 59, 79, 48, 90, 82, 64, 39, 21, 60, 37, 47, 10, 52, 77, 33, 45, 35, 83, 16, 69, 74, y 27. En el conjunto 2, se utilizaron los genes , 17, 64, 82, 23, 5, 77, 48, 72, 63, 34, 60, 61, 35, 58, 19, 56, 83, 8, 13, 38, 89, 59, 62, 88, 71, 11, 29, 31, 68, 65, 67, 78, 44, 27, 81, 24, 1, 18, 55, 85, 46, 41, 14, 84, 26, 16, 21, 12, y 69. En el conjunto 3, se utilizaron los genes 24, 39, 35, 15, 49, 44, 28, 58, 20, 3, 88, 23, 54, 31, 33, 37, 62, 25, 87, 75, 17, 41, 21, 19, 38, 85, 86, 74, 8, 12, 77, 30, 27, 43, 76, 73, 9, 14, 6, 63, 64, 81, 26, 66, 2, 56, 34, 60, 57, y 61. En el conjunto 4, se utilizaron los genes 40, 71, 55, 63, 2, 13, 38, 58, 26, 18, 76, 74, 17, 67, 69, 4, 9, 20, 21, 10, 35, 70, 49, 37, 12, 77, 61, 60, 15, 7, 36, 89, 33, 59, 78, 39, 82, 16, 64, 28, 6, 66, 52, 5, 44, 73, 34, 75, 31, y 29. En el conjunto 5, se utilizaron los genes 16, 37,' 57, 18, 29, 66, 54, 6, 44, 70, 20, 65, 5, 61, 72, 83 85, 58, 87, 73, 23, 76, 25, 68, '49, 24, 79, 89, 55, 75, 47 19, 33, 39, 21, 63, 84, 32, 77, 40, 12, 11, 42, 50, 1, 9, 78 3, 74, y 7. En el conjunto 6, se utilizaron los genes 42, 29 74, 68, 27, 54, 15, 63, 30, 51, 78, 56, 82, 66, 80, 79, 90 64, 22, 44, 71, 2, 89, 39, 46, 52, 36, 32, 84, 6, 59, 9, 38 4, 55, 19, 7, 60, 49, 23, 73, 5, 11, 50, 70, 34, 61, 81, 67 y 28. En el conjunto 7, se utilizaron los genes 31, 27, 24 75, 7, 46, 40, 60, 51, 37, 87, 28, 67, 62, 50, 66, 61, 63 49, 1, 39, 74, 81, 4, 52, 22, 79, 45, 12, 41, 15, 90, 26, 33 78, 48, 83, 10, 53, 73, 6, 19, 71, 59, 68, 56, 64, 13, 32, y 30. En el conjunto 8, se utilizaron los genes 88, 57, 5, 4 1, 43, 12, 32, 66, 81, 90, 19, 51, 18, 55, 9, 29, 75, 11, 73 23, 61, 6, 79, 69, 60, 13, 62, 8, 71, 2, 52, 67, 59, 87, 33 80, 21, 14, 89, 39, 65, 56, 38, 47, 31, 84, 25, 45, y 41. En el conjunto 9, se utilizaron los genes 60, 45, 51, 32, 49, 2, 44, 66, 83, 50, 87, 1, 90, 28, 42, .85, 13, 40, 70, 82, 79, 89, 64, 63, 27, 52, 10, 86, 77, 15, 56, 8, 33, 53, 38, 46, 67, 19, 68, 29, 48, 21, 34, 61, 18, 55, 25, 35, 39, y 80. En el conjunto 10, se utilizaron los genes 80, 39, 23, 76, 87, 33, 30, 88, 85, 89, 24, 47, 44, 43, 48, 55, 14, 73, 22, 19, 67, 1, 42, 51, 60, 12-, 9, 6, 75, 17, 40, 25, 28, 74, -38, 66, 5, 50, 8, 37, 15, 29, 21, 11, 35, 31, 13, 36, 52, y 18. Para 55 genes, conjunto 1, se utilizaron los genes 86, 47, 80, 15, 74, 20, 79, 35, 14, 49, 41, 2, 48, 30, 81,' 65, 5, 24, 51, 10, 31, 68, 7, 21, 28, 37, 38, 4, 18, 23, 44, 77, 42, 19, 61, 27, 75, 67, 36, 22, 26, 50, 32, 58, 71, 57, 76, 1, 66, 72, 33, 6, 34, 59, y 13. En el conjunto 2, se utilizaron los genes 73, 88, 39, 52, 87, 78, 84, 1, 42, 69, 62, 58, 10, 51, 38, 14, 77, 49, 36, 35, 34, 15, 65, 60, 20, 17, 61, 2, 59, 22, 81, 11, 19, 41, 5, 29, 12, 43, 7, 4, 64, 40, 74, 48, 72, 54, 68, 86, 66, 6, 67, 89, 21, 16, y' 9. En el conjunto 3, se utilizaron los genes 28, 89, 35, 86, 49, 56, 69, 18, 15, 27, 13, 6, 51, 77, 8, 80, 16, 78, 43, 29, 37, 20, 9, 31, 32, 67, 48, 65, 82, 62,' 76, 25, 54, 41, 90, 47, 2, 71, 87, 84, 57, 74, 61, 59, 85, 75, 10, 66, 46, 73, 24, 44,-14, 4, y 7. En el conjunto 4, se utilizaron los genes 48, 76, 17, 62, 65, 87, 19, 24, 83, 29, 55, 12, 68, 82, 73, 18, 20, 10, •81, 53, 33, 56, 34, 5, 60, 46, 16, 25, 2, 42, 6, 49, 4, 45, 88, .32, 77, 8, 1, 71, 3, 27, 72, 59, 79, 64, 11, 80, 57, 61, 75, 39, 23, 52, y 37. En el conjunto 5, se utilizaron los genes 54, 77, 74, 76, 81, 17, 25, 57, 29, 36, 55, 75, 66, 15, 2, 41, 37,' 59, 12, 45, 4, 9, 69, 18, 49, 22, 42', 62, 10, 52, 48, 31, 44, 19, 79, 50, 40, 32, 89, 87, 11, 5, 73, 20, 80, 35, 70, 53, 83, 72, 88, 47, 84, 39, y 65. En el conjunto 6, se utilizaron -los genes 86, 43, 75, 90, 32, 85, 38, 54, 87, 42, 73, 55, 27, 34, 11, 14, 65, 82, 77, 21, 26, 46, 83, 10, 15, 22, 66, 20, 67, 72, 35, 68, 3, 53, 44, 50, 70, 40, 30, 31, 84, 81, 62, 51, 80, 79, 59, 57, 88, 69, 2, 64, 23, 28, y 16. En el conjunto 7, se utilizaron los genes 76, 15, 53, 8, 89, 52, 20, 3, 47, 83, 45, 31, 80, 82, 4, 57, 65, 41, 29, 77, 46, 60, 24, 33, 70, 37, 12, 66, 42, 61, 63, 86, 30, 11, 40, 27, 39, 56, 9, 49, 35, 22, 10, 48, 18, 68, 58, 62, 34, 85, 84, 26, 43, 81, y 38. En el conjunto 8, se utilizaron los genes 3, 46, 11, 89, 63, 61, 26, 69, 47, 82, 27, 39, 52, 2, 70, 6, 41, 14, 36, 30, 65, 74, 28, 34, 42, 79, 59, 4, 72, 37, 66, 50, 45, 23, 73, 71, 10, 19, 78, 62, 20, 5, 56, 25, 75, 38, 13, 86, 88, 22, 32, 58, 60, 1, y 51. En el conjunto 9, se utilizaron los genes 16, 61, 85, 3, 42, 24, 55, 4, 9, 22, 28, 31, 53, 74, 25, 52, 10, 49, 2, 21, 30, 78, 54, 26, 38, 87, , 37, 45, 84, 83, 57, 64, 65, 68, 50, 1, 34, 75, 67, 60, 5, 7, 58, 59, 76, 27, 77, 44, 32, 6, 11, 48, 56, y 15. En el conjunto 10, se utilizaron los genes 72, 86, 46, 5, 3, 29, 54, 66, 20, 44, 41, 47, 14, 65, 83, 56, 43, 26, 49, 48, 69, 24, 45, 27, 73, 11, 40, 22, 78, 2, 39, 15, 31, 35, 77, 61, 9, 52, 37, 1, 89, 79, 60, 18, 50, 17, 88, 80, '57, 71, 12, 53, 36, 58, y 42. Para 60 genes, conjunto 1, se utilizaron los genes 75, 54, 79, 78, -4, 48, 36, 29, 28, 32, 82, 38, 21, 8, 80, 46, 47, 57, 76, 50, 18, 68, 85, 13, 61, 65, 71, 56, 45, 58, 84, , 72, 43, 7, 77, 74, 69, 86, 31, 19, 63, 35, 83, 70, 3, 62, 90, 52, 87, 44, 41, 66, 12, 23, 59, 1, 10, 49, y 67. En el conjunto 2, se utilizaron los genes 6, 50, 10, 38, 29, 59, 60, 12, 74, 14, 65, 61, 54, 2, 89, 68, 9, 62, 20, 81, 70, 67, 66, 52, 45, 58, 43, 31, 86, 79, 82, 1, 42, 88, 85, 22, 87, 84, 24, 21, 5, 39, 25, 51, 40, 63, 49, 7, 35, 36, 71, 90, 47, 15, 56, 23, 83, 34, 76, y 19. En el conjunto 3, se utilizaron los genes 17, 68, 41, 53, 15, 58, 90, 21, 10, 61, 72, 44, 22, 8, 32, 47, 55, 48, 45, 3, 5, 7, 1, 4, 24, 49, 75, 54, 39, 57, 19, 70, 79, 66, 6, 60, 51, 56, 46, 14, 85, 80, 36, 31, 37, 86, 42, 84, 87, 23, 2, 81, 11, 50, 40 , 52, 13, 65, 62 , y 16.
En el conjunto 4, se utilizaron los genes 54, 24, 50, 11, 77, 63, 84, 71, 16, 51, 78, 83, 10, 28, 31, 29, 43, 14, 30, 61, 81, 58, 4, 48, 64, 37, 18, 39, 1, 67, 45, 40, 80, 79, 8, 55, 36, 2, 32, 25, 21, 46, 73, 38, 34, 52, 49, 65, 13, 66, 6, 16, , 85, 15, -44, 60, 69, 86, y 88. En el conjunto 5, se utilizaron los genes 89, 22, 12, 82, 28, 14, 87, 8, 79, 48, 69, 84, 66, 43, 88, 13, 9, 50, 75, 71, 20, 36, 5, 54, 80, 62, 4, 23, 24, 60, 19, 10, 63, 81, 68, 30, 32, 52, 56, 37, 15, 83, 16, 90, 26, 44, 78, 39, 61, 59, 45, 74, 58, 86, 35, 33, 47, 57, 18, y 42. En el conjunto 6, se utilizaron los genes 41, 38, 76, 54, 12, 29, 66, 35, 68, 80, 64, 57, 46, 25, 27, 49, 86, 36, 20, 5, 16, 19, 69, 59, 48, 4, 10, 70, 17, 60 , 50, 63, 18, 33, 65, 39, 23, 82, 51, 55, 8, 28, 53, 84, 67, 22, 71, 77, 13, 9, 42, 21, 62, 31, 78, 11, 89, 45, 52, y 74. En el conjunto 7, se utilizaron los genes 84, 12, 17, 10, 33, 56, 50, 61, 74, 21, 78, 11, 37, 36, 3, 5, 30, 43, 47, 54, 27, 32, 11 , 51, 42, 4, 76, 71, 83, 46, 57, 73, 87, 24, 90, 8, 72, 29, 35, 66, 28, 70, 22, 39, 65, 85, 1, 82, 40, 89, 80, 58, 52, 38, 59, 86, 69, 13, 16, y 14. En el conjunto 8, se utilizaron los genes 71, 3, 44, 6, 16, 69, 34, 20, 56, 72, 5 68, 9, 52, 49, 58, 79, 76, 2, 59,' 7, 73, 51, 74, 19, 88, 60 , 61, 1.3, 89, 50, 31, 40, 81, 10, 21, 54, 45, 77, 67, 36 46, 1, 43, 8.3, 55, 12, 80, 28, 41, 86/ 47, 39, 53, 17, 78 63, 87, y 48. En el conjunto 9, se utilizaron los genes 47 , 10, 11, 39, 23, 41, 29, 21, 36, 45, 49, 69, 1, 24, 66 57, 12, 56, 22, 71, 9, 89, 52, 83, 28, 80, 37, 72, 67, 76 87, 82, 5, 88, 4, 3, 68, 58, 64, 62, 46, 74, 7, 20, 15, 48 53, 54, 63, 19, 13, 43, 32, 51, 31, 33, 27, 35, y 40. En el conjunto 10, se utilizaron los genes 75, 29, 27, 66, 15, 47 14, 3, 12, 80, 31, 32, 41, 17, 74, 7, 57, 59, 64, 25, 13, 77 33, 43, 81, 55, 48, 68, 30, 54, 69, 88, 62, 86, 67, 37, 20 8, 42, 19, 70, 24, 49, 73, 23, 10, 1, 85, 89, 44, 58, 2, 11 63, 76, 5, 53, 83, 50, y 9. Para 65 genes, conjunto 1, se utilizaron los genes 55, 36, 14, 26, 67, 60, 28, 31, ' 46, 85, 16, 10, 17, 45, 73, 87, 7, 72, 90, 4, 84, 34, 78, 19, 71, 54, 29, 43, 76, 12, 35, 61, 49, 57, 89, 20, .50, 47, 86,. 88, 59, 75, 15, 8, 5, 3, 32, 81, 74, 23, 41, 13, 33, 63, 77, 22, 9, 38, 64, 69, 80, 25, 1 , 18, y 30. En el conjunto 2, se utilizaron los genes 32, 81, , 65, 79, 12, 52, 83, 2, 39, 19, 37, 44, 66, 63, 72, 56, 60, 3, 22, 70, 64, 9, 67, 15, 8, 50, 48, 71, 82, 76, 14, 28, 18, 25, 11, 29, 58, 35, 31, 10, 69, ' 38, 90, 80, 74, 53, 75, 4, 77, 89, 55, 57, 59, 51, 42, 41, 68, 23, 84, 45, 40, 20, 85, y 61. En el conjunto 3, se utilizaron los genes 33, 52, 22, 67, 7, 36, 40, 6, 56, 29, 48, 41, 28, 68, 83, -90, 51, 70, 60, 24, 87, 88, 18, 58, 73, 1, 17, 8, 26, 89, 38, 4, 10, 47, 75, 72, 50, 13, 23, 66, 20, 30, 12, 43, 46, 15, 16, 5, 55, 31, 63, 32, 53, 69, 39, 71, 42, 62, 57, 34, 44, 14, 25, 64, y 80. En el conjunto 4, se utilizaron ios genes 30, 45, 74, 3, 13, 63, 76, 27, 46, 11, 51, 2, 20, 78, - 66, 65, 43, 7, 69, 40, 28, 19, , 52, 26, 34, 49, 44, 60, 59, 38, 48, 85, 87, 18, 82, 15, 42, 24, 67, 61, 71, 70, 35, 68, 79, 47, 83, 80, 84, 31, 32, 9, 77, 72, 62, 8, 55, 54, 1, 58, 16, 53, 89, y 90. En el conjunto 5, se utilizaron los genes 14, 55, 53, 45, 32, 63, 49, 15, 10, 11, 47, 52, 3, 13, 71, 68, 85, 34, 66, 64, 83, 78, 28, 21, 30, 54, 29, 88, 59, 73, 26, 84, 50, 77, 65, 82, 20, 86, 19, 57, 62, 25, 43, 27, 8, 6, 87, 38, 51, 61, 56, 2, 18, 46, 44, 80, 9, 31, 36, 76, 1, 7, 33, 48, y 58. En el conjunto 6, se utilizaron los genes 66, 44, 18, 85, 54, 28, 80, 65, 25, 1, 88, 72, 74, 46, 76, 71, 24, 51, 47, 31, 21, 60, 83, 32, 3, 63, 64, 69, 52, 27, 2, 38, 34, 10, 12, 35, 77, 33, 29, 56, 67, 40, 30, 22, 49, 5, 7, 43, 17, 13, 81, 20, 79, 14, 48, 73, 53, 90, 70, 59, 19, 16, 8, 36, y 23. En el conjunto 7, se utilizaron los genes 89, 37, 48, 32, 75, 46, 90, 2, 66, 44, 55, 17, 9, 59, 68, 83, 24, 53, 19, 67, 74, 35, 72, 4, 13, 76, 15, 62, 63, 28, 51, 26, 39, 20, 18, 45, 36, 78, 41, 84, 87, 11, 80, 12, 81, 3, 50, 86, 6, 61, 73, 31, 27, 88, 42, 71, 33, 43, 60, 30, 69, 34, 21, 49, y 70. En el conjunto 8, se utilizaron los genes 84, 73, 14, 23, 36, 47, 31, 61, 57, 50, 78, 53, 90, 68, 37, 39, 75, 4, 10, 80, 35, 32, 85, 18, 81, 29, 66, 76, 54, 41, 62, 30, 58, 49, 33, 64, 45, 87, 25, 79, 20, 69, 42, 17, 88, 24, 2, 34, 16, 28, 86, , 7, 82, 1, 60, 11, 48, 89, 22, 77, 74, 72, 6, y 43. En .el conjunto 9, se utilizaron los genes 1, 74, 39, 48, 44, 47, 3, 8, 80, 54, 16, 41, 76, 9, 85, 86, 49, 70, 52, 89, 19, 66, 43, 17, 15, 63, 29, 53, 42, 32, 30, 4, 36, 7, 77, 2, 84, 87, 28, 67, 20, 56, 65, 31, 12, 25, 40, 10, 73, 6, 83, 64, 50, 13, 22, 58, 45, 21, 57, 60, 72, 82, 26, 33, y 35. En el conjunto 10, se utilizaron los genes 18, 31, 52, 70, 48, 76, 57, 66, , 14, 60, 30, 67, 45, 35, 51, 1, 79, 46, 71, 3, 42, 33, 85, 4, 61, 2, 63, 87, 50, 36, 37, 90, 80, .24, 6, 77, 28, 21, 88, 17, 82, 83, 49 , 75, 54, 25, 5, 7, 73, 59, 29, 69, 47, 65, 19, 15, 56, 9, 55, 58, 40, 20, 89, y 74. Para 70 genes, conjunto 1, se utilizaron los genes 79, 50, 38, 63, 74, 71, 66, 4, 33, 1, 69, 88, 85, 18, 27, 77, 70, 65, 14, 40, 64, 29, 59, 6,- 3, 9-, 84, 22, 62, 60, 30, 7, 11, 13, 45, 57, 35, 72, 15, 75, 39, 36, 10, 53, 67, 80, 83, 31, 5, 25, 90, 89, 58, 23, 56, 2, 16, 41, 76, 47, 26, 43, 17, 55, 82, 87, 24, 12, 48, y 81. En el conjunto 2, se utilizaron los genes 6, 66, 68, 83, 77, 81, 21, 88, 18, 60, 50, 17, 13, 61, 14, 25, 39, 76, 75, 7.8, 89, 37, 87, 59, 55, 90, 9, 5, 12, , 43, 29, 51, 31, 46, 58, 49, 24, 52, 28, 64, 42, 8, 11, 67, 84, 70, 19, 41, 45, 71, 16, 33, 23, 34, 30, 86, 69, 4, 57, 47, 80, 20, 82, 2, 1, 56, 65, 62, y 48. En el conjunto 3, se utilizaron los genes 72, 87, 89, 53, 56, 17, 84, 60, 45, 61, 62, 76, 13, 37, 20, 21, 2, 23, 3, 57, 83, 90, 82, 49, 24, 59, 9, 48, 32, 33, 47, 42, 78, 88, 65, 52, 79, 41, 34, 19, 74, 66, 43, 27, 36, 63, 81, 44, 40, 80, 31, 86, 12, 29, 77, 67, 14, 71, 68, 1, 35, 16, 10, 30, 6, 22, 75, 55, 85, y 4. En el conjunto 4, se utilizaron los genes 70, 81, 71, 17, 8, 59, 6, 15, 52, 74, 23, 9, 19, 14, 82,- 86, 27, 73, 66, 38, 22, 41, 88, 76, 47, 58, 56, 11, 55, 64, 44, 84, 62, 21, 35, 80, 36, 28, 12, 13, 4, 1, 75, 60 , 5, 87, 89, 2, 50, 46, 25, 85, 37, 90, 78, 34, 24, 18, 45, 79, 77, 30, 32, 51, 57, 67, 83, 68, 54, y 29. En el conjunto 5, se utilizaron los genes 70, 23, 22, 30, 85, 48, 21, 32, 86, 84, 78, 87, 64, 40, 4, 34, 67, 19, 25, 7, 55, 42, 65, 53, 49 , 83, 50, 80, 62, 16, 37, 77, 71, 54, 28, 27, 29, 18, 13, 57, 79, 56, 15, 36, 5, 24, 3, 1, 75, 90, 73, 47, 51, 88, 38, 58, 66, 81, 35, 76, 43, 46, 82, 68, 10, 14, 8, 41, 39, y 59. En el conjunto 6, se utilizaron los genes 88, 3, 40, 60, 24, 43, 62, 85, 58, 53, 39, 56, 59, 81, 71, 63, 25, 16, 22, 14, 10, 72, 89, 90, 84, 5, 33, 12, 45, 57, 70, 38, 32, 19, 44, 46, 2, 64 , 8, 49 , 42, 27, 37, 29, 13, 6, 28, 7, 77, 41, 17, 50, 31, 69, 26, 83, 23, 73, 80, 51, 61, 76, 82, 18, 15, 78, 67, 54, 36, y .65. En el conjunto 7, se utilizaron los genes 35, 52, 48, 42, 65, 38, 61, 79, 23, , 12, 8, 53, 57, 22, 54, 69, 9, 56, 43, 5, 66, 86, 49, 81, 19, 40, 45, 85, 60, 10, 50, 55, 11, 15, 73, 13, 2, 29, 59, 78, 67, 18, 80, 84, 39, 87, 90, 58, 46, 17, 32, 7, 62, 14, 34, 27, 6, 83, 70, 51, 26, 68, 21, 82, 77,.44, 47, 24, y 37.
En el conjunto 8, se utilizaron los genes 40, 55, 22, 47, 86, 19, 62, 51, 25, 59, 8, 65, 48, 79, 1, 66, 17, 70, 32, 49, 23, 61, 85, 28, 36, 54, 20, 39, 83, 73, 50, 4, 81, 27, 41, 63, 15, 80, 87, 7, 46, 33, 9, 68, 56, 77, 14, 75, 82, 74, 12, 37, 16, 84, 72, 30, 2, 38, '13, 57, 76, 5, 64, 45, 89, 58, 29, 10, J 8 , y 90. En el conjunto 9, se utilizaron los genes 84, 16, 21, 81, 89, 60, 79, 30, 47, 69, 83, 85, 75, 52, 49, 72, 86, 3, 9, 59, 18, 55, 17, 82, 14, 23, 38, 24, 87, 65, 77, 80, 66, 19, 41, 53, 1, 34, 27, 56, 40, 67, 32, 20, 37, 70, 36, 15, 22, 8, 29, 48, 58, 45, 25, 71, 7, 4, 73, 10, 12, 2, 42, 90, 63, 43, 51, 6, 54, y 78. En el- conjunto 10, se utilizaron los genes 19, 51, 29, 22, 66, 13, 32, 89, 62, 45, 65, 35, 24, 73, 55, 47, 67, 76, 69, 26, 37, 64, 53, 10, 15, 34, 79, 2, 56, 30, 3, 20, 78, 31, 75, 46, 27, 52, 6, 86, 16, 9, 54, 87, 58, 33, 61, 11, 43, 40, 74, 60, 50, 25, 80, 72, 83, 57, 38, 1, 70, 5,' 7, 77, 85, 59, 88, 63, 14, y 84. Para 75 genes, conjunto 1, se utilizaron los genes 87, 17, 52, 44, 57, 53, 78, 37, 2, 71, 9, 68, 6, 63, 50, 58, 13, 26, 16, 60, 67, 3, 32, 21, 79, 12, 77, 73, 24, 35, 80, 47, 29, 40, 30, 84, 39, 90, 11, 81, 75, 76, 89, 66, 86, 42, 34, 64, 54, 7, 41, 56, 62, 55, 46, 28, 5, 25, 27, 83, 19, 20, 49, 69, 85, 33, 18, 23,' 74, 1, 10, 43, 22, 8, y 45. En el conjunto 2?, se utilizaron los genes 75, 33, 52, 86, 24, 50, 70, 10, 17, 90 , 28, 46, 48 , 11 , 47, 61, 12, 4, 83, 27, 45, 88, 35, 36, 22, 68, 73, 31, 57, 69, 65, 64, 15, 9, 54, 39, 14, 20, 67, 79, 44, 38, 78, 23, 84, 37, 66, 5, 11,' 18, 41, 13, 21, 49, 16, 76, 1, 29, 53, 40, 42, 63, 25, 56, 6, 82, 71, 85, 89, 80, 34, 51, 60, 30, y 58. En el conjunto 3, se utilizaron los genes 39, 82, 36, 31, 52, 84, 30, 83, 49, 1, 44, 10, 87, 78, 77, 18, 79, 9, 73, 69, 75, 45, 14, 16, 56, 40, 58, 15, 32, 34, 42, 60, 19, 63, 47, 41, 68, 13, 61, 90, 89, 5, 46, 57, 8, 37, 66, 43, 21, 17, 11, 72, 74, 4, 33, 53, 12, 65, 50, 2, 81, 24, 62, 6, 23, 25, 88, 51, '67, 64, 7, 80, 54, 22, y 3. En el conjunto 4, se utilizaron los genes 63, 2, 5, 52, 10, 62, 75, 4, 6, 51, 29, 54, 49, 55, 36, 37, 77, 46, 44, 79, 11, 59, 38, 14, 65, 43, 48, 35, 86, 78, 73, 72, 57, 8, 16, 58, 56, 82, 60, 42, 80, 13, 9, 90, 53, 66, 21, 67, 88, 89, 45, 22, 71, 31, 84, 74, 15, 23, 26, 3, 68, 1, 39, 7, 50, 41, 40, 81,' 87, 34, 18, 12, 70, 47, y 25. En el conjunto 5, se utilizaron los genes 62, 82, 46, 89, 8Í, 43, 57, 69, 9, 19, 18, 16, 80, 63, 72, 2, 54, 8*6, 44, 53, 31, 5, 1, 61, 20, 37, 58, 32, 28, 47, 34, 6, 41, 68, 15, 90, 85, 13, 23, 10, 4, 70, 76, 33, 11, 51, 35, 88, 67, 84, 8, 24, 66, 65, 26, 59, 40, 79, 64, 42, 45, 22, 17, 87, 30, 12, 27, 14, 39, 56, 38, 71, 52, 36, y 60. En el conjunto 6, se utilizaron los genes 16, 85, 19, 39, 64, 76, 44, 15, 50, 73, 27, 36, 6, 62, 54, 46, 58, 68, 28, 13, 14, 21, 86, 47, 71, 87, 18, 5, 67, 1, 65, 78, 12, 66, 43, 82, 38, 23, 75, 24, 49, 57, 17, 10, 29, 72, 22, 89, 90, 26, 42, 45, 2, 33, 41, 9, 8, 7, 69, 31, 30, 79, 80, 84, 55, 35, 20, 70, 83, 48, 88, 60, 25, 74, y 63. En el conjunto 7, se utilizaron los genes 24, 66, 86, 48, 63, 51, 74, 37, 2, 82, 77, 22, 72, 21, 11, 90, 80, 55, 76, 68, 34, 42, 29, 62, 46, 39, 56, 31, 47, 28,. 16, 38, 44, 52, 1, 43, 14, 20, 64, 83, 78, 58, 12, 18, 84, 67, 75, 85, 36, 25, 50, 49, 40, 33, 23, 45, 41, 73, 88, 59, 17, 32, 70, 13, 60, 57, 3, 7, 54, 4, 8, 53, 26, 15; y 69. En el conjunto 8, se utilizaron los genes 80, 38, 59, 41, 85, 44, 12, 22, 39, 17, 52, 24, 32, 62, 18, 8, 78, 74, 9, 66, 76, 14, 3, 16, 40, 28, 48, 58, 54, 29, 43, 5, 81, 77, 86, 23, 75, 82, 34, 7, 51, 64, 4, 6, 72, 61, 37, 84, 45, 33, 71, 19, 67., 88, 1, 35, 47, 83, 25, 49, 11, 42, 50, 70, 2, 46, 15, 26, 27, 68, 57, 65, 13, 53, y 90. En el conjunto 9, se utilizaron los genes 4, 66, 28, 44, 20, 34, 12, 85, 6, 17, 88, 8, 39, 65, 22, 19, 10, 48, 63, 23, 33, 13, 47, 81, 79, 89, 64, 53, 87, 11, 46, 74, 14, 70, 37, 62, 30, 7, 71, 76, 50, -59, 77, 51, 15, 68, 55, 72, 83, 82, 78, 54, 25, 21, 27, 41, 69, 9, 58, 3, 31, 75, 84, 26, 86, 49, 18, 42, 61, 45, 16, 2, 24, 80, y 73. En el conjunto , se utilizaron los genes 78, 47, 32, 30, 46, 6, 2, 64, 11, 27, 85, 22, 79, 63, 80, 39, 90, 65, 71, 72, 21, 26, 58, 15, 16, 23, 81, i, 44, 43, 40, 55, 13, 19, 25, 83, 41, 18, 53, 68, 37, 20, 49, 69, 33, 61, 38, 28, 60, 45, 17, 82, 24, 4, 86, 89, 36, 51, 84, 31, 14, 88,' 59, 76, 48, 5, 35, 75, 74, 7, 67, 62, 52, 56, y 54. Para 80 genes, conjunto 1, se utilizaron los genes 29, 80, 5, 50, 63, 3, 1, 55, 38, 48, 58, 30, 86, 82, 83, 6, 23, 2, 41, 60 , 54, 69, 15, 34, 64, 10, 27, 70, 28, 44, 8, 68, 56, 14, 36, 17, 73, 13,.88, 42, 72, 59, 67, 71, 26, 53, 37, 24, 79, 62, 52, 7,4, 4, 40, 47, 19, 78, 11, 76, 31, 90, 12, 87, 89, 75, 66, 81, 16, 49, 65, 57, 84, 46, 20, y 21. En el conjunto 2, se utilizaron los genes 15, 21, 70, 5, 79, 85, 84, 53, 69, 33, 28, 14, 75, 76, 58, 48, 13, 45, 51, 88, 25, 74, 39, 71, 64, 9, 60, 44, 78, 7, 8, 3, 32, 89, 73, 1, 4, 29, 41, 17, 46, 57, 72, 20, 86, 47, 49, 87, 55, 19, 37, 27, 80; 62, 54, 18, 52, 67, 63, 77,. 65, 24, 31, 26, 83, 2, 22, 90, 50, 12, 16, 35, 11, 10, y 56. En el conjunto 3, se utilizaron los genes 41, 4, 59, 73, 29, 22, 60, .45, 70, 10, 64,.21, 81, 36, 52, 67, 54, 38, 65, 90, 27, 87, 28, 7,' 74, 43, 56, 75, 9, , 42, 20, 72, 47, 14, 63, 18, 68, 23, 69, 8, 50, 89, 3, 11, 82, 39, 80, 46, 16, 53, 58, 25, 79, 49, 76, 37, 30, 78, 83, 2, 84, 57, 88, 6, 32, 12, 71, 15, 55, 48, 34 , 62, 61, y .13. En el conjunto 4, se utilizaron los genes 23, 31, 53, 90, 3, 40, 34, 6, 1, 83, 9, 60 , 56, 50, 44, 85, 51, 35, 43, 80, 65, 46, 38, 88, 17, 54, 87, 10, 45, 42, 75, 68, 63, 58, 36, 64, 67, 77, 21, 47, 30, 59, 14, 49, 70, 66, 72, 74, 27, 61, 19, 81, 20, 25, 33, 57, 62, 76, 55, 78, 84, 16, 69, 37, 79, 29, 39, 32, 15, 5, 2, 12, 71, 11, y 73. En el conjunto 5, se utilizaron los genes 29, 71, 21, 60, 43, 78, 55, 61, 51, 90, , 37, 35, 53, 28, 62, 15, 1, 31, 67, 48, 36, 75, 27, 63, 87, 24, 32, 54, 79, 16, 70, 64, 40 , 47, 41, 17, 38, 3, 45, 81, 68, 72, 56, 77, 8, 13, 34, 57, 26, 73, 14, 6, 82, 4, 58, 89, 30, 7, 74, 69, 88, 20, 5, 46, 2, 11, 49, 50, 23, 33, 42, 83, 52, y 86. En el conjunto 6, se utilizaron los genes 39, 54, 30, 24, 80, 10, 21, 7, 14, 69, 38, 83, 52, 65, 46, 42, 66, 36, 61, 16, 50, 33, 2, 73, 13, 81, 48, 8, 6, 41, 12, 25, 43, 79, 35, 26, 89, 75, 60, 67, 82, 45, 20, 90, 68, 77, 58, 34, 18, 47, 22, 84, 4, 57, 32, 5, 19, 59, 86, 74, 1, 31, 62, 85, 29, 53, 88, 28, 40, 37, 63, 15, 64, 49, y 55. En el conjunto 7, se utilizaron los genes 21, 68, 81, 50, 36, 6, 80, 76, 90, 74, 12, 79, 34, 53, 1, 4, 5, 41, 56, 47, 15, 63, 11, 14, 7, 78, 57, 65, 73, 20, 8, 64, 84, 30, 3, 13, 52, 49, 27, 86, 60, 72, 62, 29, 75, 40, 32, 2, 82, 33, 10, 24, 51, 17, 46, 38, 19, 37, 28, 69, 61, 85, 88, 22, 48, 89, 18, 25, 71, 58, 31, 35, 26, 55, y 44. En el conjunto 8, se utilizaron los genes 30, 64, 67, 79, 52, 71, 13, 3, 22, 8, 75, 41, 65, 21, 60, 36, 49, 84, 33, 29, 57, 86, 15, 12, 85, 63 , 6, 20, 66, 53, 51, 90, 87, 55, 11, 32, 31, 61, 78, 58, 42, 48, 5, 1, 17, 50, 70, 76, 25, 45, 2, 73, 28, 14, 89, 56, 39, 44, 7, 74, 16, 72, 35, 19, 47, 27, 43, 33, 68, 26, 18, 37, 69, 54, y 23. En el conjunto 9, se utilizaron los genes 79, 85, 48, 29, 23, 31, 62, 37, 5, 33, 3, 19, 53, 9, 36, 18, 58, 17, 81, 46 , 8, , 66, 87, 14, 30, 74, 77, 21, 40, 75, 43, 42, 15, 39, 70, 60, 13, 10, 2, 72, 44, 45, 38, 4, 25, 84, 68, 50, 24, 7, 27, 82, 55, 80, 32, 89, 57, 6, 69, 83, 28, 56, 22, 16, 1, 41, 63, 26, 78, 12, 59, 64, 61, y 11. En el conjunto 10, se utilizaron los genes 45, 9, 24, 85, 68, 80, 73, 17, 56, 7, 8, , 69, 58, 37, 44, 21, 29, 50, 15, 53, 25, 40, 88, 36, 32, '59, 75, 49, 35, 43, 67, 83, ' 31, 51, 28, 60, 77, 30, 74, 22, 41, 42, 64, 61, 23, 90, 13, 33, 11, 16, 20, 46, 66, 6, 87,. 39, 47, 65, 3, 82, 10, 72, 34, 18, 1, 38, 57, 79, 71, 26, 27, 19, 48, y 76. Para 85 genes, conjunto 1, se utilizaron los genes 62, 19, 38, 77, 64, 49, 14, 16, 47, 73, 28, 3, 54, 78, 70, 12, 75, 35, 15, 40, 21, 60, 58, 86, 83, 33, 66, 59, 44, 45, 56, 9, 5, 81, 72, 68, 27, 37, 71, 52, 48, 36, 79, 6, 41, 74, 22, 46, 2, 20, 34, 13, 55, 53, 10, 88, 57, 61, 4, 39, 24, 85, 76, 87, 65, 25, 23, 90, 32, 26,' 80, 63, 89, 82, y 7. En el conjunto 2, se utilizaron los genes 72, 30, 36, 64, 47, 57, 67, 20, 58, 1, 6, 61, 71, 32, 42, 53, 87, 65, 25, 17, 9, 60, 83, 12, 51, 8, 37, 75, 59, 89, 85, 22, 44, 19, 63, 7, 62, 13, 81, 41, 79, 43, 49, 4, 34, 68, 88, 74, 28, 31, 10, 39, 11, 55, 15, 5, 69, 50, 66, .18, 77, 46, 76, 33, 3, 35, 38, 14, 40, 86, 54, 23, 24, 48, y- 78. En el conjunto 3, se utilizaron los genes 5, 67, 57, 18, 12, 42, 43, 71, 50, 19, 26, 51, 52, 32, 74, 88, 46, 2, 9, 77, 30, 58, 69, 81, 35, 87, 90, 34, 22, 15, 84, 44, 8, 3, 47, 60, 55, 66, 33, 20, 86, 39, 16,- 37, 85, 73, 4, 13, 56, 27, 65, 76, 49, 54, 75, 31, 68, 82, 23, 62, 7, 53, 78, 36, 64 , 40 , 45, 6, 70, 17, 79, 10, 21, 48, y 89. En el conjunto 4, se utilizaron los genes 67, 47, 68, 38, 50, 82, 54, 56, 64, 49, 63, 14, 22, 7, 25, 12, 57, 85, 88, 5, 28, 23, 77, 44, 80, 89, 83, 20,' 81, 73, 11, 17, 76, 75, 32, 34, 55, 62, 21, 6, 30, 10, 71, 3-9, 36, 74, 42 , 60, 43', 8, 59, 58, 65, 3, 61, 72, 70, 79, 16, 13, 18, 19, 45, 4, 84, 1, 87, 26, 46, 40, 37, 78, 15, 69, y 41. En el conjunto 5, se utilizaron los genes 82, 42, 35, 86, 14, 37, 39, 30, 41, 60, 44, 9, 12, 34, 50, 68, 5, 29, 46, 19, 11, 28, 48, 3, 20, 77, 67, 57, 88, 55, 32, 78, 51, 71, 47, 63, 6, 10, 45, 70, 8,- 81, 18, 43, 69, 79, 21, 13, 66, 59, 33, 1, 31, 74, 36, 2, 24, 54, 23, 85, 72, 73, 80, 64, 84, 7, 38, 87, 58, 75, 22, 65, 15, 53, y 52. En el conjunto 6, se utilizaron los genes 55, 2, 11, 72, 4, 85, 43, 18, 46, 27, 80, 69, 9, 31, 39, 5, 81, 22, 32, 3, 36, 17, 83, 37, 90, 38, 87, 44, 56, 66, 13, 6, 28, 77, 54, 79, 41, 78, 47, 29, 8, 21, 63, 64, 73, 48, 14, 34, 82, 70, 30, 58, 84, 24, 26, 68, 1, 65, 60, 42, 33, 20, 7, 75, 12, 57, 59, 16, 74, 88, 23, 49, 50, 40, y 71. En el conjunto 7, se utilizaron los genes 18, 40,- 66, 35, 20, 85, 12, 19, 86, 26, 36, 89, 84, 88, 74, 15, 33, 75, 50, 16, 49, 32, 38, 31, 2, 27,' 87, 68, 69, 53, 60, 79, 7, 21, 63, 17, 90, 30, 29, 11, 56, 25, 58, 62, 48,. 8, 45, 9, 72, 64, 28, 76, 3, 78, 46, 1, 10, 34, 43, 83, 5, 52, 14, 65, 51, 41, 22, 44, 61, 24, 70, 54, 59, 77, y 13.
'En el conjunto 8, se utilizaron los genes 35, 40 , 80, 57, 23, 28, 9, 83, 13, 47, 82, 36, 86, 44, 90, 55, 30, 22, 12, 42, 38, 49, 45, 8, 87, 17, 52, 3, 33, 15, 32, 21, 76, 58, 7, 53, 20, 67, 19, 29, 85, 68, 71, 39, 24, 25, 84, 4, 6, 75, 63, 73, 5, 18, 31, 48, 65, 41, 60, 37, 88, 72, 1, 46, 79, 16, 78, 10, 77, 34, 66, 56, 61, 70, y 2. En el conjunto 9, se utilizaron los genes 51, 59, 73, 9, 79, 21, 39, 67, 71, 68, 28, 65, 85, 30, 41, 61, 29, 8, 16, 78, 34, 1, 77, 90, 45, 33, 60, 89, 49, 56, 43, 62, 83, 6, 11, 18, 50, 66, 47, 19, 4, 22, 13, 27, 86, 26, 20, 17, 52, 10, 70, 54, 42, 53, 24, 76, 81, 75, 38, 64 , 74, 36, 48, 32, 82, 44, 37, 57, 72, 35, 7, 14, 15, 3, y 23. En el conjunto 10, se utilizaron los genes 18, 85, 61, 1, 52, 87, 42, 13, 88, 66, 46, 57, 50, 36, 75, 39, 14, 27, 54, 20, 53, 10, 4, 30, 37, 43, 79, 80, 40, 84, 76, 45, 60, 74, 12, 31, 15', 44, 48, 3, 56, 11, 68, 19, 86, 72, 6, 9, 21, 70, 34, 83, 89, 5, 69, 64, 22, 24, 63, 65, 55, 8, 41, 28, 2, 16, 35, 77, 26, 47, 90, 49, 59, 23, y 17. Ejemplo 5: Detección basada en PCR Como se mencionó en lo anterior, la determinación o medición de la expresión de gen se puede realizar mediante PCR, tal como el uso de PCR cuantitativa. La expresión de detección de 50 o más secuencias expresadas en el genoma humano se pueden utilizar en tales modalidades de la invención. Adicionalmente, los niveles de expresión de 50 o más secuencias de gen en el conjunto, de 74, el conjunto de 90, o un conjunto de combinación de los dos (con un total de 126 secuencias de gen dada la presencia de 38 secuencias de gen en común entre dos conjuntos) también puede ser utilizada. La invención contempla el uso de la PCR cuantitativa para medir los niveles de expresión, como es de'scrito en lo anterior, de 87 secuencias de gen (o 50 o más secuencias de las mismas) , todas las cuales están presentes en ya sea el conjunto de 74 o el conjunto de 90. De las 87 secuencias de gen, 60 están presentes en el conjunto de 74, y 63 están presentes en el conjunto . de 90. Los identificadores/números" de acceso de las 87 secuencias de gen son AA456140, AA745593, AA765597, AA782845, AA865917, AA946776, AA993639, AB038160, AF104032, AF133587, AF301598, AF332224, AI041545, AI147926, AI309080, AI341378, AI457360, AI620495, AI632869, AI683181, AI685931, AI802118, AI804745, AI952953, AI985118, AJ000388, AK025181, AK027147, AK054605, AL023657, AL039118, AL110274, AL157475, AW118445, A 194680, A 291189, A 298545, A 445220, A 473119, AY033998, BC000045, BC001293, BC001504, BC001639, BC002551, BC004331, BC004453, BC005364, BC006537, BC006811, BC006819, BC008764, BC008765, BC009084, BC009237, BC010626, BC011949, BC012926, BC013117, BC015754, BC017586, BE552004, BE962007, BF224381, BF437393, BF446419, BF592799, BI493248, H05388, H07885, H09748, M95585, N64339, NM_000065, NM_001337, NM_003914, NM_004062, NM 004063, NM 004496, NM 006115, NM 019894, NM 033229, R15881, R45389, R61469, X69699, y X96757. El uso de 50 a todas estas secuencias en la práctica de la invención puede incluir el uso de niveles de expresión medidos para las secuencias de gen de referencia como es descrito en la presente. En algunas modalidades, las secuencias de gen de referencia son una o más de las 8 divulgadas en la presente. La invención contempla el uso de una o más de las secuencias de referencias identificadas por AF308803, AL137727, BC003043, BC006091, y BC016680 en modalidades basadas en PCR o QPCR de la invención. Por supuesto todas las 5 de estas secuencias de referencia también pueden ser utilizadas. Todas las referencias citadas en la presente, incluyendo patentes, solicitudes de patente y publicaciones, son incorporadas en la presente por referencia en sus totalidades, ya sea de manera previa específicamente incorporadas o no incorporadas. Habiéndose ahora descrito completamente esta invención, será apreciado por aquellos expertos en la técnica que la misma se puede realizar dentro de un amplio intervalo de parámetros equivalentes, concentraciones y condiciones sin apartarse del espíritu y alcance de la invención y sin experimentación indebida. Mientras que esta invención se ha descrito en relación con modalidades específicas de la misma, será entendido que es capaz de modificaciones adicionales. Esta solicitud se propone para cubrir cualquiera de las variaciones, usos o adaptaciones de la Invención siguiendo, en general, los principios de la invención e incluyendo tales desviaciones de la presente invención como vienen dentro de la práctica conocida o usual dentro de la técnica a la cual la invención pertenece y como puede ser aplicada a las características esenciales expuestas anteriormente en la presente .

Claims (20)

  1. REIVINDICACIONES 1. Un método para clasificar una muestra que contiene células como que contiene células de tumor de un tipo de tejido, el método caracterizado porque comprende determinar los niveles de expresión de 50 a 350 secuencias transcritas de células en una muestra que contiene células obtenida de un sujeto humano, y clasificar la muestra como que contiene células de tumor de un tipo de tejido de una pluralidad de tipos de tumor basado en los niveles de expresión de las secuencias.
  2. 2. - Un método para clasificar una muestra que contiene células como que contiene células de tumor de un tipo de tejido, el método caracterizado porque comprende determinar los niveles de expresión de- 50 o más secuencias transcritas de .células en una muestra que contiene células obtenidas de un sujeto humano, y clasificar la muestra como que contiene células de tumor de un tipo de tejido de una pluralidad de tipos de tumor basado en los niveles de expresión de las secuencias, en donde a) la expresión de más de 50% de las secuencias transcritas no están correlacionadas con la expresión de otras de las secuencias transcritas o b) las 50 o más secuencias transcritas no son seleccionadas en base al aprendizaje supervisado utilizando muestras de tumor conocidas, en el nivel de correlación entre su expresión y la pluralidad de tipos de tumor, o en su rango en correlación entre su expresión y la pluralidad de tipos de tumor.
  3. 3. El método de conformidad con la reivindicación 1 o 2, caracterizado porque además comprende determinar los niveles de expresión de un número en exceso de secuencias transcritas, los niveles de expresión que no se utilizan en la clasificación.
  4. 4. El método de conformidad con la reivindicación 3, caracterizado porque los niveles de expresión se determinan mediante el uso de un microarreglo.
  5. 5. El método de conformidad con la reivindicación 1 o 2 o 3 o 4, caracterizado porque la clasificación es con una precisión de 60% o más alta. -
  6. 6. El método de conformidad con la reivindicación 1 o 2 o 3 o 4, caracterizado porque 50 o más secuencias transcritas comprenden uno o más seleccionados del conjunto de 74 secuencias de gen o el conjunto de 90 secuencias de gen.
  7. 7. El método de conformidad con la reivindicación 6, caracterizado porque 50 o más secuencias transcritas comprenden cinco o más seleccionados del conjunto de 74 secuencias de gen o el conjunto de 90 secuencias de gen.
  8. 8. El método de conformidad con la reivindicación 1 o 2 o .3 o 4 o 5 o 6 o 7 ,' caracterizado porque la determinación comprende la medición en comparación a una o más secuencias transcritas de referencia.
  9. 9. El método de conformidad con la reivindicación 1 o 2 o 3 o 4 o 5 o 6 o 7 u 8, caracterizado porque la determinación comprende la medición de la expresión de • todas o parte de las secuencias transcritas.
  10. 10. El método de conformidad con cualquiera de las reivindicaciones 1-9, caracterizado porque la determinación comprende la amplificación de toda o parte de las secuencias transcritas, o la transcripción inversa y la marcación de RNA correspondiente a las secuencias transcritas.
  11. 11. El método de conformidad con la reivindicación 10, caracterizado porque la amplificación comprende la amplificación de RNA lineal o PCR cuantitativa.
  12. 12. El método de conformidad con la reivindicación 10, caracterizado porque la amplificación es de las secuencias presentes dentro de 600 nucleótidos de los sitios de poliadenilación de los transcriptos.
  13. 13. El método de conformidad con la reivindicación 10, caracterizado porque la amplificación es la amplificación de PCR cuantitativa de por lo menos 50 nucleótidos de los transcriptos.
  14. 14. Un microarreglo, caracterizado porque comprende sondas de oligonucleótido para detectar los productos de amplificación de la reivindicación 10.
  15. 15. El método de conformidad con cualquiera de las reivindicaciones 1-9, caracterizado porque las secuencias transcritas se seleccionan para ser no redundantes.
  16. 16. El método de conformidad con la reivindicación 15, caracterizado porque además comprende determinar los niveles de expresión de un número en exceso de secuencias transcritas que son redundantes a aquellas utilizadas para la clasificación.
  17. 17. El método de conformidad con cualquiera de las reivindicaciones 1-9, caracterizado porque la muestra es una muestra clínica de un paciente humano.
  18. 18. El método de conformidad con la reivindicación 17, caracterizado porque la muestra es una muestra incrustada en parafina, fijada con formalina (FFPE) .
  19. 19. El método de conformidad con cualquiera de las reivindicaciones 1-9, caracterizado porque además comprende, antes de la determinación de los niveles de expresión de 50 o más secuencias transcritas, la diagnosis de un sujeto humano como en necesidad de tal determinación; o la obtención de una muestra que contiene células de un sujeto humano; o la recepción de una muestra que contiene células; o . seccionamiento de una muestra que contiene células; o el aislamiento de las células de una muestra que contiene células; o la obtención de RNA de las células de una muestra que contiene células .
  20. 20. El método de conformidad con cualquiera de las reivindicaciones 1-9, caracterizado porque además comprende, después de la determinación de los niveles de expresión de 50 o más secuencias transcritas y la clasificación de la muestra, el procesamiento del reembolso o pago para la determinación o clasificación al indicar que 1) el pago se ha recibido, o 2) el pago será hecho por otro pagador, o 3) el pago permanece sin pago; o la recepción del reembolso para la determinación o la clasificación; o el adelantamiento o tener adelantada una petición de reembolso a una compañía aseguradora, organización de mantenimiento de la salud, agencia de salud federal, o al paciente para la determinación o clasificación; o la recepción de la indicación de la aprobación para el pago o negación del pago para la determinación o clasificación; o el envío de una petición para el reembolso para la determinación o clasificación; o la indicación de la necesidad para el reembolso o pago en una forma o en una base de datos para la determinación o clasificación; o la indicación de la realización de la determinación o clasificación en una forma o en una base de datos; o el reporte de los resultados de la determinación o clasificación, opcionalmente a una instalación del cuidado de la salud, proveedor del cuidado de la salud, un doctor, una enfermera, o al paciente; o la recepción de un pago del - paciente para la realización de la determinación o clasificación.
MXPA06014116A 2004-06-04 2005-06-03 Identificacion de tumores. MXPA06014116A (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US57708404P 2004-06-04 2004-06-04
PCT/US2005/019736 WO2005118879A2 (en) 2004-06-04 2005-06-03 Identification of tumors

Publications (1)

Publication Number Publication Date
MXPA06014116A true MXPA06014116A (es) 2007-08-08

Family

ID=35463477

Family Applications (1)

Application Number Title Priority Date Filing Date
MXPA06014116A MXPA06014116A (es) 2004-06-04 2005-06-03 Identificacion de tumores.

Country Status (12)

Country Link
US (4) US20060094035A1 (es)
EP (2) EP2371969B1 (es)
JP (2) JP5690039B2 (es)
KR (1) KR20070057761A (es)
CN (1) CN101035909A (es)
AU (1) AU2005250495A1 (es)
CA (1) CA2569531A1 (es)
DK (1) DK1751313T3 (es)
ES (2) ES2682466T3 (es)
IL (1) IL179811A (es)
MX (1) MXPA06014116A (es)
WO (1) WO2005118879A2 (es)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040219565A1 (en) 2002-10-21 2004-11-04 Sakari Kauppinen Oligonucleotides useful for detecting and analyzing nucleic acids of interest
US20120258442A1 (en) 2011-04-09 2012-10-11 bio Theranostics, Inc. Determining tumor origin
ES2682466T3 (es) 2004-06-04 2018-09-20 Biotheranostics, Inc. Identificación de tumores
EP1838870A2 (en) * 2004-12-29 2007-10-03 Exiqon A/S NOVEL OLIGONUCLEOTIDE COMPOSITIONS AND PROBE SEQUENCES USEFUL FOR DETECTION AND ANALYSIS OF MICRORNAS AND THEIR TARGET MRNAs
US20070065840A1 (en) * 2005-03-23 2007-03-22 Irena Naguibneva Novel oligonucleotide compositions and probe sequences useful for detection and analysis of microRNAS and their target mRNAS
WO2006132982A2 (en) * 2005-06-03 2006-12-14 Aviaradx, Inc. Normalization genes
CN101297045A (zh) 2005-06-03 2008-10-29 阿威亚拉德克斯股份有限公司 肿瘤和组织的鉴定
WO2007073737A1 (en) * 2005-12-29 2007-07-05 Exiqon A/S Detection of tissue origin of cancer
JP2007267692A (ja) * 2006-03-31 2007-10-18 Sysmex Corp 乳がんのリンパ節転移マーカー、プライマ及びこのマーカーを用いた乳がんのリンパ節転移判定方法
US20100113284A1 (en) * 2008-04-04 2010-05-06 Alexander Aristarkhov Small interfering rna (sirna) target site blocking oligos and uses thereof
US20120040863A1 (en) * 2009-04-16 2012-02-16 National Research Council Of Canada Process for tumour characteristic and marker set identification, tumour classification and marker sets for cancer
JP2014518086A (ja) * 2011-06-29 2014-07-28 バイオセラノスティクス インコーポレイテッド 腫瘍起源の決定
WO2014160645A2 (en) 2013-03-15 2014-10-02 Biotheranostics, Inc. Neuroendocrine tumors
CN109055562B (zh) * 2018-10-29 2022-12-20 深圳市颐康生物科技有限公司 一种生物标志物、预测肾细胞癌的复发和死亡风险的方法

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6285701B1 (en) 1998-08-06 2001-09-04 Lambda Physik Ag Laser resonator for improving narrow band emission of an excimer laser
WO2000029044A2 (en) 1998-11-13 2000-05-25 Pro Duct Health, Inc. Devices and methods to identify ductal orifices during nipple aspiration
US6647341B1 (en) 1999-04-09 2003-11-11 Whitehead Institute For Biomedical Research Methods for classifying samples and ascertaining previously unknown classes
WO2001094629A2 (en) * 2000-06-05 2001-12-13 Avalon Pharmaceuticals Cancer gene determination and therapeutic screening using signature gene sets
EP1339872A2 (en) * 2000-09-19 2003-09-03 Whitehead Institute For Biomedical Research Genetic markers for tumors
US20050260572A1 (en) 2001-03-14 2005-11-24 Kikuya Kato Method of predicting cancer
US20030148295A1 (en) * 2001-03-20 2003-08-07 Wan Jackson Shek-Lam Expression profiles and methods of use
JP2005503779A (ja) 2001-06-10 2005-02-10 アイアールエム,エルエルシー 致死性の高い癌の分子シグネチャー
ATE503023T1 (de) * 2001-06-18 2011-04-15 Rosetta Inpharmatics Llc Diagnose und prognose von brustkrebspatientinnen
US7504222B2 (en) * 2001-10-31 2009-03-17 Millennium Pharmaceuticals, Inc. Compositions, kits, and methods for identification, assessment, prevention, and therapy of breast cancer
WO2003041562A2 (en) 2001-11-14 2003-05-22 Whitehead Institute For Biomedical Research Molecular cancer diagnosis using tumor gene expression signature
US20040002067A1 (en) * 2001-12-21 2004-01-01 Erlander Mark G. Breast cancer progression signatures
EP2261369B1 (en) * 2002-03-13 2014-05-14 Genomic Health, Inc. Gene expression profiling in biopsied tumor tissues
US20040098367A1 (en) 2002-08-06 2004-05-20 Whitehead Institute For Biomedical Research Across platform and multiple dataset molecular classification
AU2003298786A1 (en) * 2002-11-26 2004-06-18 Protein Design Labs, Inc. Methods of detecting soft tissue sarcoma, compositions and methods of screening for soft tissue sarcoma modulators
US20050208500A1 (en) * 2003-03-04 2005-09-22 Erlander Mark G Signatures of ER status in breast cancer
US20060265138A1 (en) 2003-03-14 2006-11-23 David Bowtell Expression profiling of tumours
US20050003341A1 (en) * 2003-07-01 2005-01-06 Hanan Polansky Drug discovery assays based on the biology of atherosclerosis, cancer, and alopecia
AU2004298604B2 (en) 2003-12-15 2010-09-23 The Regents Of The University Of California Molecular signature of the PTEN tumor suppressor
JP2008504803A (ja) 2004-01-09 2008-02-21 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア 遺伝子発現の細胞型特異的パターン
US20050272061A1 (en) 2004-02-19 2005-12-08 Seattle Genetics, Inc. Expression profiling in non-small cell lung cancer
ES2682466T3 (es) 2004-06-04 2018-09-20 Biotheranostics, Inc. Identificación de tumores
WO2006080597A1 (en) 2005-01-31 2006-08-03 Digital Genomics Inc. Markers for the diagnosis of lung cancer
CN101297045A (zh) * 2005-06-03 2008-10-29 阿威亚拉德克斯股份有限公司 肿瘤和组织的鉴定
WO2007137366A1 (en) 2006-05-31 2007-12-06 Telethon Institute For Child Health Research Diagnostic and prognostic indicators of cancer
CN101641599A (zh) 2007-03-23 2010-02-03 霍夫曼-拉罗奇有限公司 作为肺癌标志物的apex
CA2678919A1 (en) 2007-03-27 2008-10-02 Ranit Aharonov Gene expression signature for classification of cancers
US20100273172A1 (en) 2007-03-27 2010-10-28 Rosetta Genomics Ltd. Micrornas expression signature for determination of tumors origin
JP2011501949A (ja) 2007-10-31 2011-01-20 ロゼッタ ゲノミックス エルティーディー. 特定の癌の診断及び予後診断
WO2009153775A2 (en) 2008-06-17 2009-12-23 Rosetta Genomics Ltd. Methods for distinguishing between specific types of lung cancers
GB0904957D0 (en) 2009-03-23 2009-05-06 Univ Erasmus Medical Ct Tumour gene profile

Also Published As

Publication number Publication date
EP1751313A2 (en) 2007-02-14
ES2682466T3 (es) 2018-09-20
US20200190597A1 (en) 2020-06-18
US20130023441A1 (en) 2013-01-24
EP2371969A1 (en) 2011-10-05
WO2005118879A3 (en) 2006-04-13
JP5690039B2 (ja) 2015-03-25
US10538816B2 (en) 2020-01-21
US20170268064A1 (en) 2017-09-21
DK1751313T3 (da) 2015-10-26
EP2371969B1 (en) 2018-05-23
WO2005118879A2 (en) 2005-12-15
JP5878904B2 (ja) 2016-03-08
US20060094035A1 (en) 2006-05-04
EP1751313B1 (en) 2015-07-22
JP2014183838A (ja) 2014-10-02
CN101035909A (zh) 2007-09-12
AU2005250495A1 (en) 2005-12-15
CA2569531A1 (en) 2005-12-15
IL179811A (en) 2017-10-31
ES2548514T3 (es) 2015-10-19
JP2008501345A (ja) 2008-01-24
IL179811A0 (en) 2007-05-15
KR20070057761A (ko) 2007-06-07

Similar Documents

Publication Publication Date Title
US20230023867A1 (en) Identification of tumors and tissues
US10538816B2 (en) Identification of tumors
JP6684775B2 (ja) 甲状腺状態の診断のための方法および組成物
JP2012509061A (ja) 疾患診断のための分子プロファイリングの方法および組成物
EP2754720A1 (en) Prostate cancer survival and recurrence
US20180073085A1 (en) Determining tumor origin
US20180051342A1 (en) Prostate cancer survival and recurrence
WO2013002750A2 (en) Determining tumor origin
US20090215037A1 (en) Dynamically expressed genes with reduced redundancy
US20220106646A1 (en) Determining tumor origin
MX2007015252A (es) Identificacion de tumores y tejidos
US20060286579A1 (en) Normalization genes