ES2682466T3 - Identificación de tumores - Google Patents
Identificación de tumores Download PDFInfo
- Publication number
- ES2682466T3 ES2682466T3 ES10011848.8T ES10011848T ES2682466T3 ES 2682466 T3 ES2682466 T3 ES 2682466T3 ES 10011848 T ES10011848 T ES 10011848T ES 2682466 T3 ES2682466 T3 ES 2682466T3
- Authority
- ES
- Spain
- Prior art keywords
- genes
- sequences
- tumor
- seq
- types
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
- G16B25/10—Gene or protein expression profiling; Expression-ratio estimation or normalisation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/10—Signal processing, e.g. from mass spectrometry [MS] or from PCR
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/30—Unsupervised data analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H20/00—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
- G16H20/10—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6834—Enzymatic or biochemical coupling of nucleic acids to a solid phase
- C12Q1/6837—Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/112—Disease subtyping, staging or classification
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Chemical & Material Sciences (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Genetics & Genomics (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Theoretical Computer Science (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Data Mining & Analysis (AREA)
- Public Health (AREA)
- Epidemiology (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Immunology (AREA)
- Analytical Chemistry (AREA)
- Pathology (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Bioethics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Oncology (AREA)
- Hospice & Palliative Care (AREA)
- Primary Health Care (AREA)
- Signal Processing (AREA)
- Medicinal Chemistry (AREA)
Abstract
Un método para clasificar una muestra que contiene células que contienen células tumorales de un tipo tisular, comprendiendo dicho método, determinar los niveles de expresión de 50 o más secuencias transcritas en células de una muestra que contiene células obtenida de un sujeto humano, y clasificar la muestra que contiene células tumorales de uno o más de una pluralidad de tipos tumorales conocidos comparando los niveles de expresión de dichas secuencias en dichas células con los niveles de expresión de dichas secuencias en la pluralidad de tipos tumorales conocidos, en el que las 50 o más secuencias transcritas se seleccionan aleatoriamente, en el que dicha clasificación se realiza usando un algoritmo de clasificación basado en distancia,
Description
5
10
15
20
25
30
35
40
45
50
55
60
65
DESCRIPCION
identificación de tumores Aplicaciones relacionadas Campo de la invención
La presente invención se refiere al uso de expresión génica para clasificar tumores humanos. La clasificación se realiza mediante el uso de perfiles de expresión génica, o patrones, de 50 o más secuencias expresadas que se correlacionan con tumores que surgen de ciertos tejidos así como que se correlacionan con ciertos tipos tumorales. La invención también posibilita el uso de 50 o más secuencias génicas específicas, cuya expresión se correlaciona con la fuente tisular y el tipo de tumor en diversos cánceres. Los perfiles de expresión génica, bien realizados en expresión de ácido nucleico, expresión de proteínas u otros formatos de expresión, pueden usarse para determinar que una muestra que contiene células contiene células tumorales de un tipo tisular o de un origen tisular para permitir una identificación más precisa del cáncer y por lo tanto tratamiento del mismo, así como el pronóstico del sujeto del que se obtuvo la muestra.
Sumario de la invención
La presente invención se refiere al uso de mediciones de expresión génica para clasificar o identificar tumores en muestras que contienen células obtenidas de un sujeto en una situación clínica, tal como en casos de muestras fijadas en formalina, incluidas en parafina (FFPE). La invención proporciona la capacidad para clasificar tumores en las condiciones del mundo real a las que se enfrenta un hospital y otros laboratorios que tienen que realizar ensayos sobre muestras de FFPE clínicas. La invención también puede aplicarse a otras muestras, tal como muestras nuevas, que no se han sometido a ningún tratamiento o se han sometido a poco o mínimo tratamiento (tal como simplemente almacenamiento a una temperatura reducida, no de congelación), y muestras congeladas. Las muestras pueden ser de una muestra tumoral primaria o de un tumor que ha resultado de una metástasis de otro tumor. Como alternativa, la muestra puede ser una muestra citológica, tal como, pero sin limitación, células en una muestra sanguínea. En algunos casos de una muestra tumoral, los tumores pueden no haberse sometido a clasificación por técnicas de patología tradicionales, pueden haberse clasificado inicialmente, pero se desea confirmación, o se han clasificado como un “carcinoma primario desconocido” (CUP) o “tumor de origen desconocido” (TUO) o “tumor primario desconocido”. La necesidad de confirmación es particularmente relevante a la luz de las estimaciones de 5 a 10 % de clasificación errónea usando técnicas convencionales. Por lo tanto, puede verse que la invención proporciona un medio para identificación de cáncer o CID.
En un primer aspecto de la invención, la clasificación se realiza mediante el uso de perfiles de expresión génica, o patrones, de 50 o más secuencias expresadas. Los perfiles de expresión génica, ya sea incorporados en la expresión de ácido nucleico, la expresión de proteína, u otros marcadores de expresión génica, pueden usarse para determinar que una muestra que contiene células, como células tumorales de un tipo de tejido o de un origen tisular, permiten una identificación más precisa del cáncer y, por lo tanto, el tratamiento de los mismos, así como el pronóstico del sujeto de quien se obtuvo la muestra.
En algunas realizaciones, la invención se usa para clasificar entre al menos 34 o al menos 39 tipos tumorales con precisión significativa en una situación clínica. La invención se basa en parte en el descubrimiento sorprendente e inesperado de que 50 o más secuencias expresadas en el genoma humano se pueden clasificar entre al menos 34, o al menos 39, tipos tumorales, así como subconjuntos de esos tipos tumorales, de una manera significativa. Dicho de otro modo, la invención se basa en parte en el descubrimiento de que no es necesario usar aprendizaje supervisado para identificar secuencias génicas que se expresan en correlación con diferentes tipos tumorales. Por lo tanto, la invención se basa en parte en el reconocimiento de que 50 o más secuencias expresadas cualesquiera, incluso una colección aleatoria de secuencias expresadas, tienen la capacidad de clasificarse, y por lo tanto pueden usarse para clasificar, una célula como una célula tumoral de un tejido u origen tisular.
En otro aspecto, la invención proporciona la clasificación de la muestra que contiene células como que contiene una célula tumoral de un tipo u origen tisular determinando los niveles de expresión de 50 o más secuencias transcritas y clasificando después la muestra que contiene células como que con tiene una célula tumoral de una pluralidad (dos o más) de tipos tumorales. Para clasificar entre al menos 34 a al menos 39 tipos tumorales, y subconjuntos de los mismos, pueden usarse tan pocas como 50 secuencias expresadas para proporcionar clasificación de una manera significativa. La invención también se basa en parte en la observación de que no es necesario que las secuencias expresadas sean los niveles de expresión de los que están evidentemente o en gran medida correlacionados (directamente, o indirectamente mediante correlación con otra secuencia expresada) con cualquiera de los tipos tumorales. Por lo tanto, la invención proporciona, en una realización adicional, el uso de los niveles de expresión de genes, cuyos niveles de expresión no se correlacionan fuertemente con la clasificación real de la muestra tumoral particular, como una de las 50 o más secuencias transcritas. Todos los genes seleccionados pueden ser no correlacionados tales, o solamente una parte de los genes puede ser no correlacionados, típicamente al menos 90 %, 85 %, 75 %, 50 % o 25 %, así como partes que quedan dentro de los intervalos creados usando dos cualesquiera
5
10
15
20
25
30
35
40
45
50
55
60
65
de los ejemplos de puntos anteriores como puntos finales de un intervalo.
La invención se práctica determinando los niveles de expresión de secuencias génicas en los que no es necesario que las secuencias se hayan seleccionado basándose en una correlación de sus niveles de expresión con los tipos tumorales para clasificar. Por lo tanto, como ejemplo no limitante, no es necesario que las secuencias génicas se seleccionen basándose en sus valores de correlación con tipos tumorales o una clasificación basada en los valores de correlación. Adicionalmente, la invención puede practicarse con uso de niveles de expresión génica que no se correlacionan necesariamente con uno o más niveles de expresión génica distintos usados para clasificación. Por lo tanto, en realizaciones adicionales, la capacidad para que el nivel de expresión de una secuencia expresada actúe en la clasificación no es redundante con (independiente de) la capacidad de al menos otro nivel de expresión génica usado para clasificación.
La invención puede aplicarse para identificar el origen de un cáncer en un paciente en una amplia diversidad de casos incluyendo, pero sin limitación, identificación del origen de un cáncer en una situación clínica. En algunas realizaciones, la identificación se realiza por clasificación de una muestra que contiene células que se sabe que contiene células cancerosas, pero el origen de estas células es desconocido. En otras realizaciones, la identificación se realiza por clasificación de una muestra que contiene células como que contiene una o más células cancerosas seguido de identificación del origen o los orígenes de esa célula o esas células cancerosas. En realizaciones adicionales, la invención se práctica con una muestra de un sujeto con un historial previo de cáncer, y se realiza identificación mediante clasificación de una célula como cancerosa de un origen previo de cáncer o un nuevo origen. Las realizaciones adicionales incluyen en las que se usan múltiples cánceres hallados en el mismo órgano o tejido y la invención se usa para determinar el origen de cada cáncer, así como si los cánceres son del mismo origen.
La invención también se basa en parte en el descubrimiento de que los niveles de expresión de secuencias génicas particulares pueden usarse para clasificar entre tipos tumorales con mayor precisión que los niveles de expresión de un grupo aleatorio de secuencias génicas. En una realización, la invención posibilita el uso de niveles de expresión de 50 a 74 secuencias expresadas de un primer conjunto en el genoma humano para clasificar entre al menos 34 o al menos 39 tipos tumorales con precisión significativa. La invención posibilita por lo tanto la identificación y el uso de patrones de expresión génica (o perfiles o “identificaciones”) basados en las 50 a 74 secuencias expresadas como se correlacionan con al menos los 34 o 39 tipos tumorales. La invención también posibilita el uso de 50 a 74 de estas secuencias expresadas para clasificar entre subconjuntos de los 34 o 39 tipos tumorales. Dependiendo del número de tipos tumorales, pueden conseguirse precisiones que varían de más del 80 % al 100 %.
En otra realización, la invención proporciona el uso de niveles de expresión de 50 a 90 secuencias expresadas de un segundo conjunto en el genoma humano para clasificar entre al menos 34 o al menos 39 tipos tumorales con precisión significativa. 38 de las secuencias en el segundo conjunto están presentes en el primer conjunto de 74 secuencias. Los niveles de expresión de las 50 a 90 secuencias en el segundo conjunto pueden usarse de la misma manera que se ha descrito para el primer conjunto de 74 secuencias. Dependiendo del número de tipos tumorales, pueden conseguirse precisiones que varían de aproximadamente el 75 % a aproximadamente el 95 %.
La invención también se basa en parte en el descubrimiento de que el uso de 50 o más secuencias para clasificar entre 53 tipos tumorales, que incluyen (pero sin limitación) los 34 y 39 tipos descritos en el presente documento, estaba limitado por el número de muestras disponibles de algunos tipos tumorales. Como se indica posteriormente en el presente documento, la precisión está ligada al número de muestras disponibles de cada tipo tumoral de modo que la capacidad de clasificar tipos tumorales adicionales se consigue fácilmente mediante la aplicación de números mayores de cada tipo tumoral. Por lo tanto, aunque la invención se ejemplifica mediante el uso en la clasificación entre 34 o 39 tipos tumorales, así como subconjuntos de los 34 o 39, también pueden usarse 50 o más secuencias expresadas para clasificar entre todos los tipos tumorales con la inclusión de muestras de los tipos tumorales adicionales. Por lo tanto, la invención posibilita la clasificación de un tumor como de un tipo más allá de los 34 o 39 tipos descritos en el presente documento.
La invención se basa en los niveles de expresión de las secuencias génicas en un conjunto de células tumorales conocidas de diferentes tejidos y de diferentes tipos tumorales. Estos perfiles de expresión génica (de secuencias génicas en las diferentes células/tipos tumorales conocidos), bien realizados en expresión de ácido nucleico, expresión de proteínas u otros formatos de expresión, pueden compararse con los niveles de expresión de las mismas secuencias en una muestra tumoral desconocida para identificar la muestra como que contiene un tumor de un tipo particular y/o un origen o tipo celular particular. La invención proporciona, tal como en una situación clínica, las ventajas de una identificación más precisa de un cáncer y por lo tanto el tratamiento del mismo sí como el pronóstico, incluyendo supervivencia y/o probabilidad de reaparición del cáncer después del tratamiento, del sujeto del que se obtuvo la muestra.
La invención también se basa además en parte en el descubrimiento de que el uso de 50 o más secuencias expresadas como se describen en el presente documento como capaces de clasificarse entre dos o más tipos tumorales necesariamente y efectivamente elimina uno o más tipos tumorales de la consideración durante la clasificación. Esto refleja la falta de necesidad de seleccionar genes con niveles de expresión que estén altamente correlacionados con todos los tipos tumorales dentro del intervalo del sistema de clasificación. Dicho de otro modo,
5
10
15
20
25
30
35
40
45
50
55
60
65
la invención puede practicarse con una pluralidad de genes cuyos niveles de expresión no están altamente correlacionados con ninguno de los tipos tumorales individuales o tipos múltiples en el grupo de tipos tumorales que se clasifican. Esto se diferencia de otros enfoques basados en la selección y el uso de genes altamente correlacionados, que probablemente no “descartan” otros tipos tumorales a diferencia de “incluir” un tipo tumoral basándose en la correlación positiva.
La clasificación de una muestra tumoral como de uno de los posibles tipos tumorales descritos en el presente documento excluyendo otros tipos tumorales se realiza por supuesto basándose en un nivel de confianza como se describe posteriormente. Cuando el nivel de confianza es bajo, o se prefiere un aumento en el nivel de confianza, la clasificación puede realizarse simplemente al nivel de un origen tisular particular o tipo celular para el tumor en la muestra. Como alternativa, y cuando una muestra tumoral no se clasifica fácilmente como un único tipo tumoral, la invención permite la clasificación de la muestra como uno de algunos tipos tumorales posibles descritos en el presente documento. Esto posibilita provechosamente la capacidad de reducir el número de posibles tipos tisulares, tipos celulares y tipos tumorales de los que considerar para selección y administración de terapia al paciente del que se obtuvo la muestra.
La invención proporciona así un medio no subjetivo para la identificación de la fuente tisular y/o el tipo tumoral de uno más cánceres de un sujeto aquejado. Aunque puede haberse usado previamente interpretación subjetiva para determinar la fuente tisular y/o el tipo tumoral, así como el pronóstico y/o tratamiento del cáncer basándose en esa determinación, la presente invención proporciona patrones de expresión génica objetivos, que pueden usarse solos o en combinación con criterios subjetivos para proporcionar una identificación más precisa de la clasificación de cáncer. La invención se aplica de forma particularmente provechosa a muestras de tumores secundarios o metastatizados, pero cualquier muestra que contenga células (incluyendo una muestra tumoral primaria) para la que la fuente tisular y/o el tipo tumoral se determina preferentemente por criterios objetivos también puede usarse con la invención. Por supuesto la determinación de clase en última instancia puede realizarse basándose en una combinación de criterios objetivos y no objetivos (o subjetivos/parcialmente subjetivos).
La invención incluye su uso como parte del cuidado clínico o médico de un paciente. Por lo tanto, además de usar un perfil de expresión de genes como se describe en el presente documento para ensayar una muestra que contiene células de un sujeto aquejado de cáncer para determinar la fuente tisular y/o el tipo tumoral del cáncer, el perfil también puede usarse como parte de un método para determinar el pronóstico del cáncer en el sujeto. La clasificación del tumor/cáncer y/o el pronóstico pueden usarse para seleccionar o determinar o alterar el tratamiento terapéutico para dicho sujeto. Por lo tanto, los métodos de clasificación de la invención pueden dirigirse al tratamiento de enfermedad, que se diagnostica completamente o en parte basándose en la clasificación. Dado el diagnóstico, puede usarse administración de un agente o una terapia antitumoral apropiada, o la retención o alternancia de un agente o una terapia antitumoral para tratar el cáncer.
Otros métodos clínicos incluyen los implicados en la provisión de cuidado médico a un paciente basándose en una clasificación como se describe en el presente documento. En algunas realizaciones, los métodos se refieren a proporcionar servicios de diagnóstico basándose en los niveles de expresión de secuencias génicas, con o sin inclusión de una interpretación de niveles para clasificar células de una muestra. En algunas realizaciones, el método para proporcionar un servicio de diagnóstico de la invención se precede de una determinación de una necesidad del servicio. En otras realizaciones, el método incluye actos en el control de la realización del servicio así como actos en la petición o recibo de reembolso por la realización del servicio.
Los detalles de una o más realizaciones de la invención se exponen en el dibujo adjunto y la descripción posterior. Otras características y ventajas de la invención resultarán evidentes a partir del dibujo y la descripción detallada, y a partir de las reivindicaciones.
Definiciones
Como se usa en el presente documento, un “gen” es un polinucleótido que codifica un producto discreto, bien de naturaleza proteica o de ARN. Se aprecia que más de un polinucleótido puede ser capaz de codificar un producto discreto. El término incluye alelos y polimorfismos de un gen que codifican el mismo producto, o un análogo del mismo asociado funcionalmente (incluyendo ganancia, pérdida o modulación de función), basándose en la localización cromosómica y la capacidad para recombinar durante la mitosis normal.
Una “secuencia” o “secuencia génica” como se usa en el presente documento es una molécula de ácido nucleico o polinucleótido compuesto de un orden discreto de bases nucleotídicas. La expresión incluye el ordenamiento de bases que codifican un producto discreto (es decir “región codificante”), bien de naturaleza proteica o de ARN. Se aprecia que más de un polinucleótido puede ser capaz de codificar un producto discreto. También se aprecia que pueden existir alelos y polimorfismos de las secuencias génicas humanas y pueden usarse en la práctica de la invención para identificar el nivel o los niveles de expresión de las secuencias génicas o un alelo o polimorfismo de las mismas. La identificación de un alelo o polimorfismo depende en parte de la localización cromosómica y la capacidad para recombinar durante la mitosis.
5
10
15
20
25
30
35
40
45
50
55
60
65
Los términos “correlacionar” o “correlación” o equivalentes de los mismos se refieren a una asociación entre la expresión de uno o más genes y otro acontecimiento, tal como, pero sin limitación, fenotipo o característica fisiológica, tal como tipo tumoral.
Un “polinucleótido” es una forma polimérica de nucleótidos de cualquier longitud, bien ribonucleótidos o bien desoxirribonucleótidos. Este término se refiere solamente a la estructura primaria de la molécula. Por lo tanto, este término incluye ADN y ARN bi y monocatenario. También incluye tipos de modificaciones conocidos incluyendo marcadores conocidos en la técnica, metilación, “protectores terminales”, sustitución de uno o más de los nucleótidos de origen natural con un análogo, y modificaciones internucleotídicas tales como enlaces sin carga (por ejemplo, fosforotioatos, fosforoditioatos, etc.), así como formas no modificadas del polinucleótido.
El término “amplificar” se usa en el sentido más amplio para indicar la creación de un producto de amplificación que puede realizarse enzimáticamente con ADN o ARN polimerasas. La “amplificación”, como se usa en el presente documento, se refiere en general al proceso de producir múltiples copias de una secuencia deseada, particularmente las de una muestra. “Múltiples copias” significa al menos 2 copias. Una “copia” no significa necesariamente complementariedad o identidad de secuencia perfecta con la secuencia molde. Se conocen en general en la técnica, métodos para amplificar ARNm, e incluyen pCr de transcripción inversa (RT-PCR) y PCR cuantitativa (o Q-PCR) o PCR en tiempo real. Como alternativa, el ARN puede marcarse directamente como el ADNc correspondiente por métodos conocidos en la técnica.
Por “correspondiente”, se entiende que una molécula de ácido nucleico comparte una cantidad de identidad de secuencia sustancial con otra molécula de ácido nucleico. Cantidad sustancial significa al menos 95 %, habitualmente al menos 98 % y más habitualmente al menos 99 %, y la identidad de secuencia se determina usando el algoritmo BLAST, como se describe en Altschul et al. (1990), J. Mol. Biol. 215: 403-410 (usando el ajuste por defecto publicado, es decir parámetros w=4, t=17).
Una “microarraymicroarray" es una matriz lineal o bidimensional o tridimensional (y fase sólida) de regiones discretas, que tienen cada una un área definida, formada en la superficie de un soporte sólido tal como, pero sin limitación, vidrio, plástico o membrana sintética. La densidad de las regiones discretas en un microarray se determina por los números totales de polinucleótidos inmovilizados para detectar en la superficie de un único soporte de fase sólida, tal como de al menos aproximadamente 50/cm2, al menos aproximadamente 100/cm2, o al menos aproximadamente 500/cm2, hasta aproximadamente 1.000/cm2 o más. Las matrices pueden contener menos de aproximadamente 500, aproximadamente 1000, aproximadamente 1500, aproximadamente 2000, aproximadamente 2500, o aproximadamente 3000 polinucleótidos inmovilizados en total. Como se usa en el presente documento, un microarray de ADN es una matriz de sondas oligonucleotídicas o polinucleotídicas colocadas en una microplaca u otras superficies usadas para hibridar con polinucleótidos amplificados o clonados de una muestra. Ya que se conoce la posición de cada grupo particular de sondas en la matriz, las identidades de un polinucleótido de la muestra pueden determinarse basándose en su unión con una posición particular en el microarray. Como alternativa al uso de un microarray, puede usarse en la práctica de la invención una matriz de cualquier tamaño, incluyendo un ordenamiento de una o más posiciones de un ordenamiento bidimensional o tridimensional en una fase sólida para detectar la expresión de una única secuencia génica. En algunas realizaciones, puede prepararse un microarray para uso con la presente invención por técnicas fotolitográficas (tal como síntesis de sondas de ácido nucleico en la superficie del extremo 3') o mediante síntesis nucleica seguido de deposición en una superficie sólida.
Debido a que la invención se basa en la identificación de la expresión génica, algunas realizaciones de la invención determinan la expresión por hibridación de ARNm, o una versión amplificada o clonada del mismo, de una célula de muestra con un polinucleótido que es único de una secuencia génica particular. Los polinucleótidos de este tipo contienen al menos de aproximadamente 16, al menos aproximadamente 18, al menos aproximadamente 20, al menos aproximadamente 22, al menos aproximadamente 24, al menos aproximadamente 26, al menos aproximadamente 28, al menos aproximadamente 30, o al menos aproximadamente 32 pares de bases
consecutivos de una secuencia génica que no se encuentra en otras secuencias génicas. El término
“aproximadamente” como se usa en la frase anterior se refiere a un aumento o una reducción de 1 del valor numérico indicado. Otras realizaciones son polinucleótidos de al menos o aproximadamente 50, al menos o aproximadamente 100, al menos aproximadamente o 150, al menos o aproximadamente 200, al menos o
aproximadamente 250, al menos o aproximadamente 300, al menos o aproximadamente 350, al menos o
aproximadamente 400, al menos o aproximadamente 450, o al menos o aproximadamente 500 bases consecutivas de una secuencia que no se encuentra en otras secuencias génicas. El término “aproximadamente” como se usa en la frase anterior se refiere a un aumento o una reducción del 10 % desde el valor numérico indicado. Polinucleótidos más largos pueden por supuesto contener desapareamientos menores (por ejemplo mediante la presencia de mutaciones) que no afectan a la hibridación con los ácidos nucleicos de una muestra. Dichos polinucleótidos también pueden denominarse sondas polinucleotídicas que son capaces de hibridar con secuencias de los genes, o partes únicas de los mismos, descritos en el presente documento. Dichos polinucleótidos pueden marcarse para ayudar en su detección. Las secuencias pueden ser las de ARNm codificado por los genes, el ADNc correspondiente a dichos ARNm y/o versiones amplificadas de dichas secuencias. En algunas realizaciones de la invención, las sondas polinucleotídicas se movilizan en una matriz, otros dispositivos de soporte sólido o en puntos individuales que localizan las sondas.
5
10
15
20
25
30
35
40
45
50
55
60
65
En otras realizaciones de la invención, toda o parte de una secuencia génica puede amplificarse y detectarse por métodos tales como la reacción en cadena de la polimerasa (PCR) y variaciones de la misma, tal como, pero sin limitación, PCR cuantitativa (Q-PCR), PCR de transcripción inversa (RT-PCR) y PCR en tiempo real (incluyendo como medio de medición de las cantidades iniciales de copias de ARNm para cada secuencia en una muestra), opcionalmente RT-PCR en tiempo real o Q-PCR en tiempo real. Dichos métodos utilizarían uno o dos cebadores que son complementarios de partes de una secuencia génica, en la que los cebadores se usan para iniciar la síntesis de ácido nucleico. Los ácidos nucleicos de nueva síntesis se marcan opcionalmente y pueden detectarse directamente o mediante hibridación con un polinucleótido de la invención. Los ácidos nucleicos de nueva síntesis pueden ponerse en contacto con polinucleótidos (secuencias que los contienen) de la invención en condiciones que permiten su hibridación. Los métodos adicionales para detectar la expresión de ácidos nucleicos expresados incluyen ensayos de protección de RNAsa, incluyendo hibridaciones de fase líquida e hibridación in situ de células.
Como alternativa, y en realizaciones adicionales de la invención, la expresión génica puede determinarse por análisis de proteína expresada en una muestra celular de interés mediante el uso de uno o más anticuerpos específicos para uno o más epítopos de productos génicos individuales (proteínas) o fragmentos proteolíticos de los mismos, en dicha muestra celular o en un fluido corporal de un sujeto. La muestra celular puede ser una de células epiteliales de cáncer de mama enriquecidas de la sangre de un sujeto, tal como mediante el uso de anticuerpos marcados contra marcadores de superficie celular seguido de clasificación celular activada por fluorescencia (FACS). Dichos anticuerpos pueden marcarse para permitir su detección después de la unión con el producto génico. Las metodologías de detección adecuadas para su uso en la práctica de la invención incluyen, pero sin limitación, inmunohistoquímica de muestras que contienen células o tejido, ensayos inmunoabsorbentes ligados a enzimas (ELISA) incluyendo ensayos de tipo sándwich de anticuerpos de tejidos que contienen células o muestras de sangre, espectroscopia de masas e inmuno PCR.
Los términos “marcador” o “marcado” se refieren a una composición capaz de producir una señal detectable indicativa de la presencia de la molécula marcada. Los marcadores adecuados incluyen radioisótopos, cromóforos nucleotídicos, enzimas, sustratos, moléculas fluorescentes, restos quimioluminiscentes, partículas magnéticas, restos bioluminiscentes y similares. Como tal, un marcador es cualquier composición detectable por medios espectroscópicos, fotoquímicos, bioquímicos, inmunoquímicos, eléctricos, ópticos o químicos.
El término “soporte” se refiere a soportes convencionales tales como perlas, partículas, varillas, fibras, filtros, membranas y sopores de silano o silicato tales como portaobjetos de vidrio.
La “expresión” y “expresión génica” incluyen transcripción y/o traducción de material de ácido nucleico.
Como se usa en el presente documento, la expresión “que comprende” y sus afines se usan en su sentido inclusivo; es decir, equivalente al término “incluyendo” y sus afines correspondientes.
Las condiciones que “permiten” que se produzca un acontecimiento o condiciones que son “adecuadas” para que se produzca un acontecimiento, tales como hibridación, extensión de cadena y similares, o condiciones “adecuadas” son condiciones que no evitan que se produzcan dichos acontecimientos. Por lo tanto, estas condiciones permiten, potencian, facilitan y/o conducen al acontecimiento. Dichas condiciones, conocidas en la técnica y descritas en el presente documento, dependen de, por ejemplo, la naturaleza de la secuencia de nucleótidos, temperatura y condiciones de tampón. Estas condiciones también dependen de qué acontecimiento se desee, tal como hibridación, escisión, extensión de cadena o transcripción.
La “mutación” de secuencia, como se usa en el presente documento, se refiere a cualquiera alteración de secuencia en la secuencia de un gen desvelado en el presente documento de interés en comparación con una secuencia de referencia. Una mutación de secuencia incluye cambios de un único nucleótido, o alteraciones de más de un nucleótido en una secuencia, debido a mecanismos tales como sustitución, deleción o inserción. El polimorfismo de un único nucleótido (SNP) también es una mutación de secuencia como se usa en el presente documento. Debido a que la presente invención se basa en el nivel relativo de expresión génica, también pueden ensayarse mutaciones en regiones no codificantes de genes como se desvela en el presente documento en la práctica de la invención.
La “detección” o “detectar” incluye cualquier medio de detección, incluyendo determinación directa e indirecta del nivel de expresión génica y cambios en el mismo.
A no ser que se defina de otro modo todos los términos técnicos y científicos usados en el presente documento tienen el mismo significado que se entiende habitualmente por un experto en la materia a la que pertenece la presente invención.
Breve descripción de los dibujos
La Figura 1 muestra una representación de capacidad con respecto a la capacidad de uso de los niveles de expresión de subconjuntos de un conjunto de 100 secuencias génicas expresadas para clasificar entre 39 tipos
5
10
15
20
25
30
35
40
45
50
55
60
65
tumorales y subconjuntos de los mismos. Se usaron niveles de expresión de combinaciones aleatorias de 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 y 100 (cada uno muestreado 10 veces) de las 100 secuencias con datos de tipos tumorales y después se usaron para predecir conjuntos aleatorios de ensayo de muestras tumorales (cada una muestreada 10 veces) que varían de 2 a 39 tipos. Una representación de números de tipos tumorales frente a precisiones de predicción para resultados usando de 50 a 100 genes se muestra como ejemplos no limitantes. En general, la precisión mejora con mayores números de secuencias génicas, cuando 50 secuencias génicas den como resultado una reducción más notable en la precisión cuando se usen con aproximadamente 20 o más tipos tumorales.
La Figura 2 muestra una presentación alternativa de los datos usados con respecto a la Figura 1. Se muestra una representación de números de secuencias génicas usadas, que varían de 50 a 100, frente a precisiones de predicción para diversos números representativos de tipos tumorales. Las líneas representadas, de la parte superior a la inferior, son de los resultados de 2, 10, 20, 30 y 39 tipos tumorales, respectivamente.
La Figura 3 muestra el rendimiento del uso de todos los genes de un primer conjunto de 74 secuencias génicas y un segundo conjunto de 90 secuencias génicas para clasificar diversos números de tipos tumorales. En general, la precisión de los dos conjuntos es muy similar, presentando el conjunto de 74 una mayor precisión más notable con aproximadamente 28 o más (hasta 39) tipos tumorales.
La Figura 4 muestra una representación de capacidad con respecto a la capacidad para usar los niveles de expresión de todo o partes de un primer conjunto de 74 secuencias génicas expresadas para clasificar entre 39 tipos tumorales y subconjuntos de los mismos. Se usaron los niveles de expresión de combinaciones aleatorias de 50, 55, 60, 65 y 70 (cada uno muestreado 10 veces) así como las 74 secuencias con datos de tipos tumorales y después se usaron para predecir conjuntos aleatorios de ensayo de muestras tumorales (cada una mostrada 10 veces) que varían de 2 a 39 tipos. Se muestra una representación de números de tipos tumorales frente a precisiones de predicción para resultados usando de 50 a 74 genes como ejemplos no limitantes. En general, la precisión mejora con mayores números de secuencias génicas, siendo más notable que el uso de 74 genes proporciona las mayores precisiones, y produciendo 50 secuencias génicas las menores precisiones, cuando se usan con aproximadamente 20 o más tipos tumorales.
La Figura 5 muestra una presentación alternativa de los datos usados con respecto a la Figura 4. Se muestra una representación de números de secuencias génicas usados, que varían de 50-74, frente a precisiones de predicción para diversos números representativos de tipos tumorales. Las líneas representadas, de la parte superior a la inferior, son de los resultados de 2, 10, 20, 30 y 39 tipos tumorales, respectivamente.
La Figura 6 muestra una representación de capacidad para la capacidad de uso de los niveles de expresión de subconjuntos de un conjunto de 90 secuencias génicas expresadas para clasificar entre 39 tipos tumorales y subconjuntos de los mismos. Se usaron los niveles de expresión de combinaciones aleatorias de 50, 55, 60, 65, 70, 75, 80 y 85 (cada una mostrada 10 veces) así como las 90 secuencias con datos de tipos tumorales y después se usaron para predecir conjuntos aleatorios de ensayo de muestras tumorales (cada una muestreada 10 veces) que varió de 2 a 39 tipos. Se muestra una representación de números de tipos tumorales frente a precisiones de predicción para resultados usando de 50 a 90 genes como ejemplos no limitantes. En general, la precisión mejora con mayores números de secuencias génicas, cuando 50 secuencias génicas den como resultado una precisión notablemente reducida cuando se usan con aproximadamente 20 o más tipos tumorales. La Figura 7 muestra una presentación alternativa de los datos usados con respecto a la Figura 6. Se muestra una representación de números de secuencias génicas usadas, que varían de 50 a 90, frente a precisiones de predicción para diversos números representativos de tipos tumorales. Las líneas representadas, de la parte superior a la inferior, son de los resultados de 2, 10, 20, 30 y 39 tipos tumorales, respectivamente.
Las Figuras 8A-8D muestran un “árbol” que clasifica los tipos tumorales abarcados en el presente documento así como tipos tumorales conocidos adicionales. Se construyó principalmente de acuerdo con “Cancer, Principles and Practice of Oncology, (DeVito, Hellman y Rosenberg), 6a edición”. Comenzando de este modo con un “tumor de origen desconocido” (o “tuo”), las primeras posibilidades son que se trata de un origen de célula germinal o célula no germinal. Si es la primera, entonces puede ser de origen ovárico o testicular. Dentro de los de origen testicular, el tumor puede ser de origen de seminoma o de “otro” origen.
Si el tumor es de un origen de célula no germinal, entonces es de origen epitelial o no epitelial. Si es el primero, entonces es de origen escamoso o no escamoso. Son tumores de origen escamoso el de origen en cuello uterino, esófago, laringe, pulmón o piel. Son tumores de origen no escamoso los de origen en vejiga urinaria, mama, intestino carcinoide, colangiocarcinoma, digestivo, riñón, hígado, pulmón, próstata, sistema reproductor, células basales cutáneas o tiroides-folicular-papilar. Entre los de origen digestivo, los tumores son de origen en el intestino delgado y grueso, adenocarcinoma del estómago, conducto biliar, esófago, vesícula biliar y páncreas. Los tumores de origen esofágico pueden ser de tipos adenocarcinoma o esófago de Barrett. De los tumores de origen en el sistema reproductor, pueden ser de origen de tipo adenocarcinoma de cuello uterino, de tumor endometrial u ovárico. Los tumores de origen ovárico son de los tipos claro, seroso, mucinoso y endometrioide.
Si el tumor es de origen no epitelial, entonces es de origen en la glándula adrenal, cerebro, GIST (tumor del estroma gastrointestinal), linfoma, meningioma, mesotelioma, sarcoma, melanoma cutáneo o tiroide-medular. De los linfomas, son de tipo linfocitos B, Hodgkin o linfocitos T. De los sarcomas, son de tipos leiomiosarcoma, osteosarcoma, sarcoma de tejidos blandos, MFH (histiocitoma fibroso maligno) de tejidos blandos, sinovial de sarcoma de tejidos blandos, sarcoma de Ewing de tejidos blandos, fibrosarcoma de tejidos blandos y rabdomiosarcoma de tejidos blandos.
5
10
15
20
25
30
35
40
45
50
55
60
65
Descripción detallada de modos de práctica de la invención
La presente invención proporciona métodos para el uso de la información de expresión génica para clasificar tumores de una manera más objetiva de lo que es posible con técnicas de patología convencional. La invención se basa en parte en los resultados de la reducción aleatoria del número de secuencias génicas usadas para clasificar una muestra tumoral como uno de una pluralidad de tipos tumorales, tales como los 34 tipos tumorales descritos posteriormente y en la Solicitud Provisional de Estados Unidos 60/577.084, presentada el 4 de junio de 2004. Se usó un número total de 16.948 genes, que se filtraron a partir de un conjunto mayor basándose en la retirada de genes que presentan señales bajas o constantes en las muestras usadas tanto para validación cruzada como para precisiones de predicción como se describe en los ejemplos posteriores. Se seleccionaron 100 selecciones aleatorias de 50, 100, 150, 200, 250, 300, 400, 500, 600, 700, 800, 900, 1000, 1200, 1400, 1600, 1800, 2000, 2200, 2400, 2600, 2800, 3000 y más genes del total y se usaron para clasificación como se describe en el presente documento.
Por lo tanto, en un primer aspecto, la invención proporciona un método para clasificar una muestra que contiene células como que incluye una célula tumoral de (o proveniente de) un tipo de tejido o un origen tisular. El método comprende determinar o medir los niveles de expresión de 50 o más secuencias transcritas de células en una muestra que contiene células obtenida de un sujeto, y clasificando la muestra que contienen células tumorales de un tipo de tejido a partir de una pluralidad de tipos de tumores basados en los niveles de expresión de dichas secuencias. Como se usa en el presente documento, "una pluralidad" se refiere a la condición de dos o más.
En algunas realizaciones de la invención, la expresión de más de 50 % de dichas secuencias transcritas no se correlaciona con la expresión de otra de dichas secuencias transcritas; y/o las 50 o más secuencias transcritas no se seleccionan basándose en aprendizaje supervisado usando muestras tumorales conocidas, sobre el nivel de correlación entre su expresión y dicha pluralidad de tipos tumorales, o sobre su clasificación en una correlación entre su expresión y dicha pluralidad de tipos tumorales.
La clasificación se basa en una comparación de los niveles de expresión de las 50 o más secuencias transcritas en las células de la muestra con sus niveles de expresión en muestras tumorales conocidas y/o muestras no tumorales conocidas. Como alternativa, la clasificación se basa en una comparación de los niveles de expresión de las 50 o más secuencias transcritas con la expresión de secuencias de referencia en las mismas muestras, en relación con, o basándose en, la misma comparación en muestras tumorales conocidas y/o muestras no tumorales conocidas. Por lo tanto como ejemplo no limitante, los niveles de expresión de las secuencias génicas pueden determinarse en un conjunto de muestras tumorales conocidas para proporcionar una base de datos frente a la que se comparan los niveles de expresión detectados o determinados en una muestra que contiene células de un sujeto. El nivel o los niveles de expresión de la secuencia o las secuencias génicas en una muestra también se pueden comparar con el nivel o los niveles de expresión de dicha secuencia o dichas secuencias génicas en células normales o no cancerosas, preferentemente de la misma muestra o del mismo sujeto. Como se describe posteriormente y en realizaciones de la invención utilizando Q-PCR o Q-PCR en tiempo real, los niveles de expresión pueden compararse con los niveles de expresión de genes de referencia en la misma muestra o puede usarse una relación de niveles de expresión.
La selección de 50 o más secuencias génicas para usar puede ser aleatoria, o por selección basada en diversos criterios. Como un ejemplo no limitante, las secuencias génicas pueden seleccionarse basándose en aprendizaje no supervisado, incluyendo técnicas de agrupamiento. Como otro ejemplo no limitante, la selección puede ser para reducir o eliminar la redundancia con respecto a su capacidad para clasificar el tipo tumoral. Por ejemplo, se seleccionan secuencias génicas basándose en la falta de correlación entre su expresión y la expresión de una o más secuencias génicas adicionales usadas para clasificación. Esto se consigue evaluando el nivel de expresión de cada secuencia génica en el conjunto de datos de expresión para correlación, a través de la pluralidad de muestras, con el nivel de expresión de cada otro gen en el conjunto de datos para producir una matriz de coeficientes de correlación. Estas determinaciones de correlación pueden realizarse directamente, entre la expresión de cada par de secuencias génicas, o indirectamente, sin comparación directa entre los valores de expresión de cada par de secuencias génicas.
Puede usarse una diversidad de metodologías de correlación en la correlación de datos de expresión de secuencias génicas individuales dentro del conjunto de datos. Los ejemplos no limitantes incluyen métodos paramétricos y no paramétricos así como metodologías basadas en la información mutua y enfoques no lineales. Los ejemplos no lineales de enfoques paramétricos incluyen correlación de Pearson (o Pearson r, también denominada correlación lineal o de momento de producto) y correlación de coseno. Los ejemplos no limitantes de métodos no paramétricos incluyen correlación de R de Spearman (u orden de rango), correlación de Tau de Kendall y la estadística Gamma. Cada metodología de correlación puede usarse para determinar el nivel de correlación entre las expresiones de secuencias génicas individuales en el conjunto de datos. La correlación de todas las secuencias con todas las otras secuencias se considera más fácilmente como una matriz. Usando la correlación de Pearson como un ejemplo no limitante, se usa el coeficiente de correlación r en el método como el indicador del nivel de correlación. Cuando se usan otros métodos de correlación, puede usarse el coeficiente de correlación análogo a r, junto con el
5
10
15
20
25
30
35
40
45
50
55
60
65
reconocimiento de niveles equivalentes de correlación correspondientes a r que es de o de aproximadamente 0,25 a o a aproximadamente 0,5.
El coeficiente de correlación puede seleccionarse según se desee para reducir el número de secuencias génicas
correlacionadas a diversos números. En algunas realizaciones de la invención usando r, el valor de coeficiente
seleccionado puede ser de aproximadamente 0,25 o mayor, aproximadamente 0,3 o mayor, aproximadamente 0,35 o mayor, aproximadamente 0,4 o mayor, aproximadamente 0,45 o mayor, o aproximadamente 0,5 o mayor. La selección de un valor de coeficiente significa que cuando la expresión entre secuencias génicas en el conjunto de datos se correlaciona a ese valor o mayor, posiblemente no se incluyan en un subconjunto de la invención. Por lo tanto en algunas realizaciones, el método comprende excluir o eliminar (no usar para clasificación) una o más secuencias génicas que se expresan en correlación, por encima de un coeficiente de correlación deseado, con otra secuencia génica en el conjunto de datos de tipo tumoral. Se señala, sin embargo, que puede haber situaciones de secuencias génicas que no se correlacionan con cualquier otra secuencia génica, en cuyo caso no se elimina necesariamente de su uso en la clasificación.
Por lo tanto, los niveles de expresión de secuencias génicas, en los que más de aproximadamente el 10 %, más de aproximadamente el 20 %, más de aproximadamente el 30 %, más de aproximadamente el 40 %, más de
aproximadamente el 50 %, más de aproximadamente el 60 %, más de aproximadamente el 70 %, más de
aproximadamente el 80 %, o más de aproximadamente el 90 % de los niveles no se correlacionan con el de otra de las secuencias génicas usadas, pueden usarse en la práctica de la invención. La correlación entre niveles de expresión puede basarse en un valor por debajo de aproximadamente 0,9, aproximadamente 0,8, aproximadamente 0,7, aproximadamente 0,6, aproximadamente 0,5, aproximadamente 0,4, aproximadamente 0,3, o aproximadamente 0,2. La capacidad de clasificar entre clases con exclusión de los niveles de expresión de algunas secuencias génicas está presente porque la expresión de las secuencias génicas en el subconjunto se correlaciona con la expresión de las secuencias génicas excluidas del subconjunto. Por lo tanto no se perdió ninguna información debido a que la información basada en la expresión de las secuencias génicas excluidas aún está representada por secuencias conservadas en el subconjunto. Por lo tanto, la expresión de las secuencias génicas del subconjunto tiene contenido de información relevante para las propiedades y/o características (o fenotipo) de una célula. Esto tiene aplicación y relevancia para la clasificación de clases de tipo tumoral adicionales no incluidas como parte del conjunto de datos de expresión génica original que puede clasificarse mediante el uso de un subconjunto de la invención porque se basa en la redundancia de información entre la expresión de secuencias en el subconjunto y secuencias expresadas en esas clases adicionales. Por lo tanto la invención puede usarse para clasificar células como de tipo tumoral más allá de la pluralidad de clases conocidas usadas para generar el conjunto de datos de expresión génica original.
También puede usarse selección de secuencias génicas basadas en la reducción de la correlación de expresión para un tipo tumoral particular. Esto también refleja un descubrimiento de la presente invención, basándose en la observación de que los niveles de expresión que estaban más altamente correlacionados con uno o más tipos tumorales no eran necesariamente de mayor valor en la clasificación entre diferentes tipos tumorales. Esto se refleja tanto por la capacidad para usar secuencias génicas seleccionadas aleatoriamente para clasificación así como el uso de secuencias particulares, como se describe en el presente documento, que no se expresan con la correlación más significativamente con uno o más tipos tumorales. Por lo tanto la invención puede practicarse sin selección de secuencias génicas basándose en los P valores más significativos o una clasificación basada en la correlación de la expresión génica y uno o más tipos tumorales. Por lo tanto la invención puede practicarse sin el uso de metodologías basadas en clasificación, tales como el ensayo H de Kruskal-Wallis.
Las secuencias génicas usadas en la práctica de la invención pueden incluir las que se ha observado que se expresan en correlación con tipos tumorales particulares, tales como la expresión del receptor de estrógenos, que se ha observado que se expresa en correlación con algunos cánceres ováricos y de mama. En algunas realizaciones de la invención, sin embargo, la invención se práctica con el uso del nivel de expresión de al menos una secuencia génica que no se ha identificado previamente que esté asociada con ninguno de los tipos tumorales que se clasifican. Por lo tanto la invención puede practicarse sin todas las secuencias génicas que se han asociado o correlacionado previamente con la expresión en los dos o más tipos tumorales (hasta 39 o más) en los que puede clasificarse una muestra que contiene células.
Aunque la invención se describe principalmente con respecto a sujetos humanos, también pueden usarse muestras de otros sujetos. Todo lo que se necesita es la capacidad de evaluar los niveles de expresión de secuencias génicas en una pluralidad de muestras tumorales conocidas de modo que pueden compararse los niveles de expresión en una muestra desconocida o de ensayo. Por lo tanto la invención puede aplicarse a muestras de cualquier organismo para las que están disponibles una pluralidad de secuencias expresadas, y una pluralidad de muestras tumorales conocidas. Un ejemplo no limitante es la aplicación de la invención a muestras de ratón, basándose en la disponibilidad del genoma de ratón para permitir la detección de secuencias murinas expresadas y la disponibilidad de muestras tumorales de ratón conocidas o la capacidad de obtener muestras conocidas. Por lo tanto, la invención se contempla para su uso con otras muestras, incluyendo las de mamíferos, primates y animales usados en ensayos clínicos (tales como ratas, ratones, conejos, perros, gatos y chimpancés) como ejemplos no limitantes.
5
10
15
20
25
30
35
40
45
50
55
60
65
Aunque la invención se practica fácilmente con el uso de muestras que contienen células, puede usarse en la práctica de la invención cualquier muestra que contenga ácido nucleico que pueda ensayarse con respecto a niveles de expresión génica. Sin limitar la invención, una muestra de la invención puede ser una que se sospeche o se sepa que contiene células tumorales. Como alternativa, una muestra de la invención puede ser una “muestra tumoral” o “muestra que contiene tumor” o “muestra que contiene células tumorales” de tejido o fluido aislado de un individuo que se sospecha que está aquejado de, o en riesgo de desarrollar, cáncer. Los ejemplos no limitantes de muestras para su uso con la invención incluyen una muestra clínica, tal como, pero sin limitación, una muestra fija, una muestra nueva o una muestra congelada. La muestra puede ser un aspirado, una muestra citológica (incluyendo sangre u otro fluido corporal) o una muestra de ensayo tisular, que incluye al menos algo de información con respecto al contexto in situ de células en la muestra de ensayo, siempre que las células apropiadas o los ácidos nucleicos estén disponibles para determinación de los niveles de expresión génica. La invención se basa en parte en el descubrimiento de que los resultados obtenidos con secciones tisulares congeladas pueden aplicarse con validez a la situación con muestras celulares o tisulares fijas y extenderse a muestras nuevas.
Los ejemplos no limitantes de muestras fijas incluyen las que se fijan con formalina o formaldehído (incluyendo muestras FFPE), con Boudin, glutaldehído, acetona, alcoholes o cualquier otro fijador, tal como los usados para fijar muestras celulares o tisulares para inmunohistoquímica (IHC). Otros ejemplos incluyen fijadores que precipitan ácidos nucleicos y proteínas asociadas a células. Dadas las posibles complicaciones en la manipulación de muestras de ensayo tisulares congeladas, tales como la necesidad de mantener su estado congelado, la invención puede practicarse con muestras no congeladas, tales como muestras fijas, muestras nuevas, incluyendo células de sangre u otro fluido o tejido corporal, y muestras mínimamente tratadas. En algunas aplicaciones de la invención, la muestra no se ha clasificado usando técnicas de patología convencionales, tales como, pero sin limitación, ensayos basados en inmunohistoquímica.
En algunas realizaciones de la invención, la muestra se clasifica como que contiene una célula tumoral de un tipo seleccionado de los siguientes 53, y subconjuntos de los mismos: Adenocarcinoma de Mama, Adenocarcinoma del Cuello Uterino, Adenocarcinoma del Esófago, Adenocarcinoma de la Vesícula Biliar, Adenocarcinoma de Pulmón, Adenocarcinoma de Páncreas, Adenocarcinoma del Intestino Delgado-Grueso, Adenocarcinoma del Estómago, Astrocitoma, Carcinoma de Células Basales de la Piel, Colangiocarcinoma del Hígado, Adenocarcinoma de Células Claras del Ovario, Linfoma de Linfocitos B Grande Difuso, Carcinoma Embrionario del Testículo, Carcinoma Endometrioide del Útero, Sarcoma de Ewing, Carcinoma Folicular del Tiroides, Tumor del Estroma Gastrointestinal, Tumor de Células Germinales del Ovario, Tumor de Células Germinales del Testículo, Glioblastoma Multiforme, Carcinoma Hepatocelular del Hígado, Linfoma de Hodgkin, Carcinoma de Células Grandes del Pulmón, Leiomiosarcoma, Liposarcoma, Carcinoma Lobular de Mama, Histiocitoma Fibroso Maligno, Carcinoma Medular del Tiroides, Melanoma, Meningioma, Mesotelioma de Pulmón, Adenocarcinoma Mucinoso del Ovario, Miofibrosarcoma, Tumor Neuroendocrino del Intestino, Oligodendroglioma, Osteosarcoma, Carcinoma Papilar del Tiroides, Feocromocitoma, Carcinoma de Células Renales del Riñón, Rabdomiosarcoma, Seminoma de Testículo, Adenocarcinoma Seroso del Ovario, Carcinoma de Células Pequeñas del Pulmón, Carcinoma de Células Escamosas del Cuello Uterino, Carcinoma de Células Escamosas del Esófago, Carcinoma de Células Escamosas de la Laringe, Carcinoma de Células Escamosas del Pulmón, Carcinoma de Células Escamosas de la Piel, Sarcoma Sinovial, Linfoma de Linfocitos T y Carcinoma de Células Transicionales de la Vejiga.
En otras realizaciones de la invención, la muestra se clasifica como que contiene una célula tumoral de un tipo seleccionado de los siguientes 34, y subconjuntos de los mismos: adrenal, de cerebro, de mama, carcinoide- intestino, cuello uterino (células escamosas), colangiocarcinoma, endometrio, células germinales, GIST (tumor del estroma gastrointestinal), riñón, leiomiosarcoma, hígado, pulmón (adenocarcinoma, células grandes), pulmón (células pequeñas), pulmón (escamoso), linfoma (linfocitos B), Linfoma (Hodgkin), meningioma, mesotelioma, osteosarcoma, ovario (células claras), ovario (células serosas), páncreas, próstata, piel (células basales), piel (melanoma), intestino delgado y grueso; tejido blando (liposarcoma); tejido blando (MFH o Histiocitoma Fibroso Maligno), tejido blando (Sarcoma-Sinovial), testículo (seminoma), tiroides (folicular-papilar), tiroides (carcinoma medular) y vejiga urinaria.
En realizaciones adicionales de la invención, la muestra se clasifica como que contiene una célula tumoral de un tipo seleccionado de los siguientes 39, y subconjuntos de los mismos: glándula adrenal, cerebro, mama, carcinoide- intestino, cuello uterino-adenocarcinoma, cuello uterino-escamoso, endometrio, vejiga urinaria, célula germinal- ovario, GIST, riñón, leiomiosarcoma, hígado, pulmón-adenocarcinoma-células grandes, pulmón-células pequeñas, pulmón-escamoso, linfoma-linfocitos B, Linfoma-Hodgkin, linfoma-linfocitos T, meningioma, mesotelioma, osteosarcoma, ovario-células claras, ovario-seroso, páncreas, próstata, piel-células basales, piel-melanoma, piel- escamoso, intestino delgado y grueso, tejido blando-liposarcoma, tejido blando-MFH, tejido blando-sarcoma-sinovial, estómago-adenocarcinoma, testículo-otro (o no seminoma), testículo-seminoma, tiroides-folicular-papilar, tiroides- medular y vejiga urinaria.
Los métodos de la invención también pueden aplicarse para clasificar una muestra que contiene células como que contiene una célula tumoral de un tumor de un subconjunto de cualquiera de los conjuntos anteriores. El tamaño del subconjunto será habitualmente pequeño, compuesto de dos, tres, cuatro, cinco, seis, siete, ocho, nueve o diez de los tipos tumorales descritos anteriormente. Como alternativa, el tamaño del subconjunto puede ser cualquier
5
10
15
20
25
30
35
40
45
50
55
60
65
número entero hasta el tamaño complejo del conjunto. Por lo tanto las realizaciones de la invención incluyen clasificación entre 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51 o 52 de los tipos anteriores. En algunas realizaciones, el subconjunto estará compuesto de tipos tumorales que son del mismo tipo tisular u orgánico. Como alternativa, el subconjunto estará compuesto de tipos tumorales de diferentes tejidos u órganos. En algunas realizaciones, el subconjunto incluirá uno o más tipos seleccionados de glándula adrenal, cerebro, carcinoide-intestino, cuello uterino- adenocarcinoma, cuello uterino-escamoso, vesícula biliar, célula germinal-ovario, GIST, leiomiosarcoma, hígado, meningioma, osteosarcoma, piel-células basales, piel-escamoso, tejido blando-liposarcoma, tejido blando-MFH, tejido blando-sarcoma-sinovial, testículo-otro (o no seminoma), testículo-seminoma, tiroides-folicular-papilar y tiroides-medular.
La clasificación entre subconjuntos de los tipos tumorales anteriores se demuestra por los resultados mostrados en las Figuras 1 y 2, en las que los niveles de expresión de tan pocos como 50 o más secuencias génicas pueden usarse para clasificar entre muestras aleatorias de 2 tipos tumorales entre las del conjunto de 39 enumerado anteriormente. Pueden usarse los niveles de expresión de 50-100 secuencias génicas (que se seleccionaron aleatoriamente) para clasificar entre 2 a 39 tipos tumorales con diversos grados de precisión. La invención puede practicarse con los niveles de expresión de 50 o más, aproximadamente 55 o más, aproximadamente 60 o más, aproximadamente 65 o más, aproximadamente 70 o más, aproximadamente 75 o más, aproximadamente 80 o más, aproximadamente 85 o más, aproximadamente 90 o más, aproximadamente 100 o más, aproximadamente 110 o más, aproximadamente 120 o más, aproximadamente 130 o más, aproximadamente 140 o más, aproximadamente 150 o más, aproximadamente 200 o más, aproximadamente 250 o más, aproximadamente 300 o más, aproximadamente 350 o más, o aproximadamente 400 o más secuencias transcritas como se encuentran en el “transcriptoma” humano (parte transcrita del genoma). La invención también puede practicarse con niveles de expresión de 50-60 o más, aproximadamente 60-70 o más, aproximadamente 70-80 o más, aproximadamente 80-90 o más, aproximadamente 90-100 o más, aproximadamente 100-110 o más, aproximadamente 110-120 o más, aproximadamente 120-130 o más, o aproximadamente 130-140 o más secuencias transcritas. En algunas realizaciones de la invención, los genes transcritos pueden seleccionarse aleatoriamente o incluyen todas o algunas de las secuencias génicas específicas desveladas en el presente documento. Como se demuestra en el presente documento, puede realizarse clasificación con precisiones de aproximadamente el 55 %, aproximadamente el 60 %, aproximadamente el 65 %, aproximadamente el 70 %, aproximadamente el 75 %, aproximadamente el 80 %, aproximadamente el 85 %, aproximadamente el 90 %, o aproximadamente el 95 % o mayor mediante el uso de la presente invención.
En otras realizaciones, los niveles de expresión génica de otras secuencias génicas pueden determinarse junto con las determinaciones anteriormente descritas de los niveles de expresión para su uso en clasificación. Un ejemplo no limitante de esto se ve en el caso de una plataforma basada en microarray para determinar la expresión génica, cuando también se mide la expresión de otras secuencias génicas. Cuando esos otros niveles de expresión no se usan en clasificación, se pueden considerar los resultados de secuencias transcritas “en exceso” y no críticas para la práctica de la invención. Como alternativa, y cuando esos otros niveles de expresión se usen en la clasificación, están dentro del alcance de la invención, en el que la descripción del uso de números particulares de secuencias no excluye necesariamente el uso de niveles de expresión de secuencias adicionales. En algunas realizaciones, la invención incluye el uso de un nivel o niveles de expresión de una o más secuencias génicas “en exceso”, tal como las que pueden proporcionar información redundante para una o más secuencias génicas distintas usadas en un método de la invención.
Debido a que la clasificación de una muestra como que contiene células de uno de los tipos tumorales anteriores también clasifica de forma inherente el origen de sitio de órgano o tejido de la muestra, los métodos de la invención pueden aplicarse a clasificación de una muestra tumoral como de un sitio de órgano o tejido particular del paciente. Esta aplicación de la invención es particularmente útil en casos en los que la muestra sea de un tumor que sea el resultado de metástasis por otro tumor. En algunas realizaciones de la invención, la muestra tumoral se clasifica como una de las siguientes 24: Adrenal, Vejiga, Hueso, Cerebro, Mama, Cuello Uterino, Endometrio, Esófago, Vesícula Biliar, Riñón, Laringe, Hígado, Pulmón, Ganglio Linfático, Ovario, Páncreas, Próstata, Piel, Tejido Blando, Intestino Delgado/Grueso, Estómago, Testículo, Tiroides y Útero.
Aunque la invención también posibilita la clasificación como uno de los tipos tumorales anteriores basándose en comparaciones con los niveles de expresión de secuencias en los 39 tipos tumorales, es posible que se desee un mayor nivel de confianza en la clasificación. Si se prefiere un aumento en la confianza de la clasificación, la clasificación puede ajustarse para identificar la muestra tumoral como de un origen o tipo celular particular como se muestra en la Figura 8. Por lo tanto puede realizarse un aumento en la confianza a cambio de una reducción en la especificidad con respecto al tipo tumoral por identificación del origen o tipo celular.
La clasificación de una muestra que contiene células como célula tumoral de uno de los 39 tipos tumorales anteriores inherentemente también clasifica el sitio tisular u orgánico origen de la muestra. Por ejemplo, la identificación de una muestra como escamosa de cuello uterino necesariamente clasifica el tumor como de origen de cuello uterino, de tipo celular escamoso (y por lo tanto de origen epitelial en lugar de no epitelial) como se muestra en la Figura 8. También significa que el tumor no era necesariamente de origen en células germinales. Por lo tanto,
5
10
15
20
25
30
35
40
45
50
55
60
65
los métodos de la invención pueden aplicarse a la clasificación de una muestra tumoral como de un sitio orgánico o tisular particular de un sujeto o paciente. Esta aplicación de la invención es particularmente útil en casos en los que la muestra es de un tumor que es el resultado de metástasis por otro tumor.
La práctica de la invención para clasificar una muestra que contiene células como que tiene una célula tumoral de uno de los tipos anteriores es mediante el uso de un algoritmo de clasificación apropiado que utiliza aprendizaje supervisado para aceptar 1) los niveles de expresión de las secuencias génicas en una pluralidad de tipos tumorales conocidos como un conjunto de entrenamiento y 2) los niveles de expresión de los mismos genes en una o más células de una muestra para clasificar la muestra como que tiene células de uno de los tipos tumorales. Se proporciona más análisis de esto en la sección de ejemplos del presente documento. Los niveles de expresión pueden proporcionarse basándose en las señales en cualquier formato, incluyendo expresión de ácido nucleico o expresión de proteínas como se describe en el presente documento.
Como resultará evidente para el experto en la materia, el intervalo de clasificación se ve afectado por el número de tipos tumorales así como el número de muestras para cada tipo tumoral. Sin embargo dadas las muestras adecuadas del intervalo completo de tumores humanos como se proporciona en el presente documento, la invención se aplica fácilmente a la clasificación de esos tipos tumorales así como tipos adicionales.
Los ejemplos no limitantes de algoritmos de clasificación que pueden usarse en la práctica de la invención incluyen algoritmos de aprendizaje supervisados, algoritmos de aprendizaje de máquina, análisis diferenciadores lineales, algoritmos de selección de atributos y redes neurales artificiales (ANN). En realizaciones preferidas de la invención, se usa un algoritmo de clasificación basado en distancia, tal como el algoritmo de vecino más cercano a k (KNN), o máquina de vector de soporte (SVM).
El uso de KNN es en algunas realizaciones de la invención y se analiza además como un ejemplo representante no limitante. KNN puede usarse para analizar los datos de expresión de los genes en un “conjunto de entrenamiento” de muestras tumorales conocidas incluyendo los 39 tipos tumorales descritos en el presente documento. El conjunto de datos de entrenamiento puede compararse después con los datos de expresión para los mismos genes en una muestra que contiene células. Los niveles de expresión de los genes en la muestra se comparan después con el conjunto de datos de entrenamiento mediante KNN para identificar las muestras tumorales con los patrones de expresión más similares. Como ejemplo no limitante, los cinco “vecinos más cercanos” pueden identificarse y los tipos tumorales de los mismos usarse para clasificar la muestra tumoral desconocida. Por supuesto pueden usarse otras cantidades de “vecinos más cercanos”. Los ejemplos no limitantes incluyen menos de 5, aproximadamente 7, aproximadamente 9 o aproximadamente 11 o más “vecinos más cercanos”.
Como un ejemplo hipotético, si los cinco “vecinos más cercanos” de una muestra desconocida son cuatro linfomas de linfocitos B y un linfoma de linfocitos T, entonces la clasificación de la muestra como del linfoma de linfocitos B puede realizarse con gran precisión. Esto se ha usado con una precisión del 84 % o mayor, tal como 90 %, como se describe en los Ejemplos.
La capacidad de clasificación puede combinarse con la naturaleza inherente del esquema de clasificación para proporcionar un medio para aumentar la confianza de la clasificación tumoral en ciertas situaciones. Por ejemplo, si los cinco “vecinos más cercanos” de una muestra son tres tumores ováricos de células claras y dos serosos ováricos, la confianza puede mejorarse simplemente tratando los tumores como de origen ovárico y tratando al sujeto o paciente (del que se ha obtenido la muestra) en consecuencia. Véase Figura 8. Esto es un ejemplo de intercambiar especificidad a favor de confianza aumentada. Esto proporciona el beneficio añadido de abordar la posibilidad de que la muestra desconocida sea un tumor mucinoso o endometrioide. Por supuesto el experto en la materia es libre de tratar el tumor como una o ambas de estas dos posibilidades más probables y proceder en consecuencia con esa determinación.
Debido a que el linaje de desarrollo de las células tumorales en ciertos tipos tumorales (por ejemplo, células germinales) puede ser complejo e implicar múltiples tipos celulares, la Figura 8 puede parecer sobresimplificada. Sin embargo, actúa como una buena base para relacionar histopatología conocida y para actuar como un “árbol guía” para analizar y relacionar identificaciones de expresión génica asociadas a tumores.
La naturaleza inherente del esquema de clasificación también proporciona un medio para aumentar la confianza de la clasificación tumoral en casos en los que los “vecinos más cercanos” sean ambiguos. Por ejemplo, si los cinco “vecinos más cercanos” fueran uno de vejiga urinaria, uno de mama, uno de riñón, uno de hígado y uno de próstata, la clasificación puede ser simplemente la de un tumor de células no escamosas. Dicha determinación puede realizarse sin confianza significativa y el sujeto o paciente del que se obtuvo la muestra puede tratarse en consecuencia. Sin quedar ligado a la teoría, y ofrecido solamente para mejorar el entendimiento de la invención, los dos últimos ejemplos reflejan las similitudes en la expresión génica de células de un tipo celular y/u origen tisular similar.
Las realizaciones de la invención incluyen uso de los métodos y materiales descritos en el presente documento para identificar el origen de un cáncer de un paciente. Por lo tanto dada una muestra que contiene células tumorales, el
5
10
15
20
25
30
35
40
45
50
55
60
65
origen tisular de las células tumorales se identifica mediante el uso de la presente invención. Un ejemplo no limitante es en el caso de un sujeto con un ganglio linfático inflamado que contiene células cancerosas. Las células pueden ser de un tejido u órgano que drena al ganglio linfático o puede ser de otra fuente tisular. La presente invención puede usarse para clasificar las células como de un tipo tumoral o tisular (u origen) particular que permite la identificación de la fuente de las células cancerosas. En un ejemplo alternativo no limitante, la muestra (tal como la de un ganglio linfático) contiene células, que se ensayan en primer lugar mediante el uso de la invención para clasificar al menos una célula como una célula tumoral de un origen o tipo tisular. Esto se usa después para identificar la fuente de las células cancerosas en la muestra. Ambos de estos son ejemplos del uso ventajoso de la invención para ahorrar tiempo, esfuerzo y coste en el uso de otros ensayos de diagnóstico de cáncer.
En realizaciones adicionales, la invención se práctica con una muestra de un sujeto con un historial previo de cáncer. Como ejemplo no limitante, puede encontrarse que una muestra que contiene células (del ganglio linfático o de otra parte) del sujeto contiene células cancerosas de modo que la presente invención puede usarse para determinar si las células son del mismo tejido o uno diferente de el del cáncer previo. Esta aplicación de la invención también puede usarse para identificar un nuevo tumor primario, tal como el caso en el que se encuentran nuevas células cancerosas en el hígado de un sujeto que ha tenido previamente cáncer de mama. La invención puede usarse para identificar las nuevas células cancerosas como el resulto de metástasis del cáncer de mama previo (o de otro tipo tumoral, bien identificado previamente o no) o como una nueva aparición primaria de cáncer de hígado. La invención también puede aplicarse a muestras de un tejido u órgano en el que se encuentran múltiples cánceres para determinar el origen de cada cáncer, así como si los cánceres son del mismo origen.
Aunque la invención puede practicarse con el uso de niveles de expresión de un grupo aleatorio de secuencias génicas expresadas, la invención también proporciona secuencias génicas ejemplares para uso en la práctica de la invención. La invención incluye un primer grupo de 74 secuencias génicas de las que 50 o más pueden usarse en la práctica de la invención. Las 50 a 74 secuencias génicas pueden usarse junto con la determinación de niveles de expresión de secuencias adicionales siempre que los niveles de expresión de secuencias génicas del conjunto de 74 se usen en clasificación. Un ejemplo no limitante de dichas realizaciones de la invención es cuando se mide la expresión de las 74 secuencias génicas, o al menos 50 (o 50 a aproximadamente 90) miembros de las mismas, junto con los niveles de expresión de una pluralidad de otras secuencias, tales como mediante el uso de una plataforma basada en microarray usada para realizar la invención. Aunque estos otros niveles de expresión no se usan en la clasificación, se pueden considerar los resultados de secuencias transcritas “en exceso” y no críticos para la práctica de la invención. Como alternativa, y cuando se usen esos otros niveles de expresión en la clasificación, están dentro del alcance de la invención, cuando el uso de las secuencias anteriormente descritas no excluya necesariamente el uso de niveles de expresión de secuencias adicionales.
Se proporcionan secuencias de ARNm correspondientes a un conjunto de 74 secuencias génicas para su uso en la práctica de la invención en el Listado de Secuencias adjunto. Se proporciona a continuación un listado de las SEQ ID Nos., con información de identificación correspondiente, incluyendo números de referencia y otra información.
>Hs.73995_mRNA_1 gi|190403|gb|M60502.1 ARNm de profilagrina humana HUMPROFILE, extremo 3' poliA = 1 (SEQ ID NO: 1)
>Hs.75236_mRNA_4 gi|14280328|gb|AY033998.1 Homo sapiens poliA = 3 (SEQ ID No: 2)
>Hs.299867_mRNA_1 gi|4758533|ref|NM_004496.1 Factor nuclear de hepatocitos 3 de Homo sapiens, alfa (HNF3A), ARNm poliA = 3 (SEQ ID NO: 3)
>Hs.285401_contig1 AI147926|AI880620|AA768316|AA761543|AA279147|AI216016|AI738663|N79248|AI684489|
AA960845|AI718599|AI379138|N29366|BF002507|AW044269|R34339|R66326|H04648|R67467|AI523112|BF94150 0 poliA = 2 poliA = 3 (SEQ ID NO: 4)
>Hs. 182507_mRNA_1 gi|15431324|ref|NM_002283,2|Queratina de Homo sapiens, pelo, básica, 5 (KRTHB5), ARNm poliA = 3 (SEQ ID NO: 5)
>Hs.292653_contig1 AI200660|AW014007|AI341199| AI692279|AI393765|AI378686| AI695373|AW292108|T10352| R44346|AW470408|AI380925|BF938983|AW003704|H08077|F03856|H08075|F08895|AW468398|AI865976|H22568| AI858374|AI216499 poliA = 2 poliA = 3 (SEQ ID NO: 6)
>Hs.97616_mRNA_3 gi|12654852|gb|BC001270.1|BC0 01270 Clon de Homo sapiens MGC: 5069 IMAGE: 3458016 poliA = 3 (SEQ ID NO: 7)
>Hs.123078_mRNA_3 gi|14328043|gb|BC009237.1 |BC0 09237 Clon de Homo sapiens MGC: 2216 IMAGE: 2989823 poliA =3 (SEQ ID NO: 8)
>Hs.285508_contig1 AW194680|BF939744|BF516467 poliA = 1 poliA = 1 (SEQ ID NO: 9)
5
10
15
20
25
30
35
40
45
50
55
60
65
>Hs.183274_contig1
BF437393|BF064008|BF509951|AW134603|AI277015|AI803254|AA887915|BF054958|AI004413|AI393911|AI27851 7|AW612644|AI492162|AI309226|AI863671|AA448864|AI640165|AA479926|AA461188|AA780161|BF591180|AI9180 20|AI758226|AI291375|BF001845|BF003064|AI337393|AI522206|BE856784|BF001760|AI280300 FLAG = 1 poliA = 2 WARN poliA = 3 (SEQ ID NO: 10)
>Hs.334841_mRNA_3 gi| 14290606|gb|BC009084.1 |BC0 09084 Clon de Homo sapiens MGC: 9270 IMAGE: 3853674 poliA =3 (SEQ ID NO: 11)
>Hs.3321_contig1 AI804745|AI492375|AA594799| BE672611|AA814147|AA722404 |AW170088|D11718|BG153444| AI680648|AA063561|BE219054|AI590287|R55185|AI479167|AI796872|AI018324|AI701122|BE218203|AA905336|AI 681917| BI084742|AI480008|AI217994| AI401468 poliA = 2 poliA = 3 (SEQ ID NO: 12)
>Hs.306216 singlet1 AW083022 poliA = 1 poliA = 2 (SEQ ID NO: 13)
>Hs.99235_contig1 AA456140|AI167259|AA450056 poliA = 2 poliA = 3 (SEQ ID N: 14)
>Hs.169172_mRNA_2 gi|2274961|emb|AJ000388.1| HSCANPX ARNm de Homo sapiens para proteasa de tipo calpaína CANPX poliA = 3 (SEQ ID NO: 15)
>Hs.351486_mRNA_1 gi| 16549178|dbj|AK054605.1 |AK 054605 ADNc de Homo sapiens FLJ30043 fis, clon 3NB692001548 poliA = 0 (SEQ ID NO: 16)
>Hs.153504_contig2
BE962007|AW016349|AW016358|AW139144|AA932969|AI025620|AI688744|AI865632|AA854291 |AA932970|AU15 6702|AI634439|AA152496|AI539557|AI123490|AI613215|AI318363|AW105672|AA843483|AI366889|AW181938|AI8 13801|AI433695|AA934772|N72230|AI760632|BE858965|AW058302|AI760087|AI682077|AA886672|AI350384|AW2 43848|AW300574| BE466359|AI859529|AI921588| BF062899|BE855597|BE617708 poliA = 2 poliA = 3 (SEQ ID NO: 17)
>Hs.199354 singletl AI669760 poliA = 1 poliA = 2 (SEQ ID NO: 18)
>Hs.162020_contig1 AW291189|AA505872 poliA = 2 poliA = 3 (SEQ ID NO: 19)
>Hs.30743_mRNA_3 gi|18201906|ref|NM_006115.2 antígeno expresado preferentemente en melanoma de Homo sapiens (PRAME), ARNm poliA = 3 (SEQ ID NO: 20)
>Hs.271580_contig1
AI632869|AW338882|AW338875|AW613773|AI982899|AW193151|BE206353|BE208200|A1811548|AW264021 poliA = 2 poliA = 3 (SEQ ID NO: 21)
>Hs.69360_mRNA_2 gi|14250609|gb|BC008764.1| BC008764 clon de Homo sapiens MGC: 1266 IMAGE: 3347571 poliA = 3 (SEQ ID NO: 22)
>Hs.30827_contig1 H07885|N39347|W85913| AA583408|W86449 poliA = 2 poliA = 3 (SEQ ID NO: 23)
>Hs.211593_contig2
BF592799|AI570478|AA234440|R40214|BE501078|AW593784|AI184050|AI284161|W72149|AW780437|AI247981|A W241273|H60824 poliA = 2 poliA = 3 (SEQ ID NO: 24)
>Hs.155097_mRNA|1 gi|15080385|gb|BC011949.1| BC011949 clon de Homo sapiens MGC: 9006 IMAGE: 3863603 poliA = 3 (SEQ ID NO: 25)
>Hs.5163_mRNA_1 gi|15990433|gb|BC015582.1| BC015582 clon de Homo sapiens MGC: 23280 IMAGE: 4637504 poliA = 3 (SEQ ID NO: 26)
>Hs.55150_mRNA_1 gi|17068414|gb|BC017586.1|BC0 17586 clon de Homo sapiens MGC: 26610 IMAGE: 4837506 poliA = 3 (SEQ ID NO: 27)
>Hs.170177_contig3
AI620495|AW291989|AA780896|AA976262|AI298326|BF111862|AW591523|AI922518|AI480280|BF589437|AA6003 54|AI886238|AA035599|H90049|BF112011|N52601|A1570965|AI565367|AW768847|H90073|BE504361|N45292|AI6 32075|AA679729|AW168052|AI978827|AI968410|AI669255|N45300|AI651256|AI698970|AI521256|AW078614|AI80 2070|AI885947|AI342534|AI653624|AW243936|T 16586|R15989|AI289789|AI871636|AI718785|AW148847 poliA = 2 poliA = 3 (SEQ ID NO: 28)
>Hs.184601_mRNA_5 gi|4426639|gb|AF104032.11 AF104032Homo sapiens poliA = 2 (SEQ ID NO: 29)
5
10
15
20
25
30
35
40
45
50
55
60
65
>Hs.351972_singlet1 AA865917 poliA = 2 poliA = 3 (SEQ ID NO: 30)
>Hs.5366_mRNA_2 gi|15277845|gb|BC012926.1| BC012926 clon de Homo sapiens MGC: 16817 IMAGE: 3853503 poliA = 3 (SEQ ID NO: 31)
>Hs.18140_contig1
AI685931 |AA410954|T97707|AA706873|AI911572|AW614616|AA548520|AW027764|BF511251 |AI914294|AW15168 8 poliA = 1 poliA = 1 (SEQ ID NO: 32)
>Hs.133196_contig2 BF224381|BE467992|AW 137689 |AI695045|AW207361|BF445141|AA405473 poliA = 2 WARN poliA = 3(SEQ ID NO: 33)
>Hs.63325_mRNA_5 gi|15451939|ref|NM_019894.1 proteasa transmembrana de Homo sapiens, serina 4 (TMPRSS4), ARNm poliA = 3 (SEQ ID NO: 34)
>Hs.250692_mRNA_2 gi|184223|gb|M95585.1| HUMHLF ARNm de factor de leucemia hepático humano (HLF), cds completo poliA = 3 (SEQ ID NO: 35)
>Hs.250726 singlet4 AW298545 poliA = 2 poliA = 3 (SEQ ID NO: 36)
>Hs.79217_mRNA_2 gi|16306657|gb|BC001504.1| BC001504 clon de Homo sapiens MGC: 2273 IMAGE: 3505512 poliA = 3 (SEQ ID NO: 37)
>Hs.47986_mRNA_1 gi|13279253|gb|BC004331.1| BC004331 clon de Homo sapiens MGC: 10940 IMAGE: 3630835 poliA = 3 (SEQ ID NO: 38)
>Hs.94367_mRNA_1 gi| 10440200|dbj|AK027147.11 AK027147 ADNc de Homo sapiens: FLJ23494 fis, clon LNG01885 poliA = 3 (SEQ ID NO: 39)
>Hs.49215_contig1 BI493248|N66529|AA452255|BI492877|AW196683|AI963900|BF478125|AI421654|BE466675
poliA = 1 poliA = 1 (SEQ ID NO: 40)
>Hs.281587_contig2
R61469|R15891|AA007214|R61471|AI014624|N69765|AW592075|H09780|AA709038|AI335898|AI559229|F09750|R 49594|H11055|T72573| AA935558|AA988654| AA826438|AI002431|AI299721 poliA = 1 poliA = 2 (SEQ ID NO: 41)
>Hs.79378_mRNA_1 gi|16306528|ref|NM_003914.2 ciclina A1 de Homo sapiens (CCNA1), ARNm poliA = 3 (SEQ ID NO: 42)
>Hs.156469_contig2 A1341378|AI670817|AI701687|AI3In set 22|AW235883|AI948598|AA446356 poliA = 2 poliA = 3 (SEQ ID NO: 43)
>Hs.6631_mRNA_1 gi|7020430|dbj|AK000380.1| AK000380 ADNc de Homo sapiens FLJ20373 fis, clon HEP19740 poliA = 3 (SEQ ID NO: 44)
>Hs.155977_contig1 AI309080|AI313045 poliA = 1 WARN poliA = 1 (SEQ ID NO: 45)
>Hs.95197_mRNA_4 gi|5817138|emb|AL110274.11 HSM800829 ARNm de Homo sapiens; ADNc DKFZp564I0272 (del clon DKFZp564I0272) poliA = 3 (SEQ ID NO: 46)
>Hs.48956_contig1 N64339|AI569513|AI694073 poliA = 1 poliA = 1 (SEQ ID NO: 47)
>Hs.118825_mRNA_10 gi|1495484|emb|X96757.11 HSSAPKK3 ARNm de H. sapiens para MAP quinasa quinasa poliA = 3 (SEQ ID NO: 48)
>Hs.135118_contig3
AI683181 |AI082848|AW770198|AI333188|AI873435|AW169942|AI806302|AW340718|BF196955|AA909720 poliA = 1 poliA = 2 (SEQ ID NO: 49)
>Hs.171857_mRNA_1 gi|13161080|gb|AF332224.1|AF332224 ARNm de proteína de testículo de Homo sapiens, cds parcial poliA = 3 (SEQ ID NO: 50)
>Hs.18910_mRNA_3 gi|12804464|gb|BC001639.1|BC001639 clon de Homo sapiens MGC: 1944 IMAGE: 2959372 poliA = 3 (SEQ ID NO: 51)
5
10
15
20
25
30
35
40
45
50
55
60
65
>Hs.194774_mRNA_1 gi|16306633|gb|BC001492.1|BC001492 clon de Homo sapiens MGC: 1774 IMAGE: 3510004 poliA = 3 (SEQ ID NO: 52)
>Hs.127428_mRNA_2 gi|16306818|gb|BC006537.1|BC006537 clon de Homo sapiens MGC: 1934 IMAGE: 2987903 poliA = 3 (SEQ ID NO: 53)
>Hs.126852_contig1
AI802118|BF197404|BF224434|AA931964|AW236083|AI253119|AW614335|AI671372|AI793240|AW006851 |AI9536 04|AI640505| AI633982|AW195809|AI493069| AW058576|AW293622 poliA = 2 poliA = 3 (SEQ ID NO: 54)
>Hs.28149_mRNA_1 gi| 14714936|gb|BC010626.1|BC010626 clon de Homo sapiens MGC: 17687 IMAGE: 3865868 poliA = 3 (SEQ ID NO: 55)
>Hs.35453_mRNA_3 gi|7018494|emb|AL157475.11 HSM802461 ARNm de Homo sapiens; ADNc DKFZp761G151 (del clon DKFZp761G151); cds parcial poliA = 3 (SEQ ID NO: 56)
>Hs.180570_contig1 R08175|AA707224|AA699986| R11209|W89099|T98002|AA494546. poliA = 2 poliA = 3 (SEQ ID NO: 57)
>Hs.196270_mRNA_1 gi|11545416|gb|AF283645.1|AF283645 mapa 8q21 de cromosoma 8 de Homo sapiens poliA = 3 (SEQ ID NO: 58)
>Hs.9030_mRNA_3 gi|12652600|gb|BC000045.1|BC000045 clon de Homo sapiens MGC: 2032 IMAGE: 3504527 poliA =3 (SEQ ID NO: 59)
>Hs.1282_mRNA_3 gi|4559405|ref|NM_000065.1 componente del complemento de Homo sapiens 6 (C6), ARNm poliA = 1 (SEQ ID NO: 60)
>Hs.268562_mRNA_2 gi|15341874|gb|BC013117.1|BC013117 clon de Homo sapiens MGC: 8711 IMAGE: 3882749 poliA = 3 (SEQ ID NO: 61)
>Hs.151301_mRNA_3 gi|16041747|gb|BC015754.1 |BC015754 clon de Homo sapiens MGC: 23085 IMAGE: 4862492 poliA = 3 (SEQ ID NO: 62)
>Hs.111_contig1 AA946776|AW242338|H24274| AI078616 poliA = 1 poliA = 2 (SEQ ID NO: 63)
>Hs. 150753_contig1 AI 123582|AI288234 poliA = 0 poliA = 0 (SEQ ID NO: 64)
>Hs.82109_mRNA_1 gi| 14250611 |gb|BC008765.1| BC008765 clon de Homo sapiens MGC: 1622 IMAGE: 3347793 poliA = 3 (SEQ ID NO: 65)
>Hs.44276_mRNA_2 gi|12654896|gb|BC001293.1|BC001293clon de Homo sapiens MGC: 5259 IMAGE: 3458115 poliA = 3 (SEQ ID NO: 66)
>Hs.2142_mRNA_4 gi|13325274|gb|BC004453.1| BC004453 clon de Homo sapiens MGC: 4303 IMAGE: 2819400 poliA = 3 (SEQ ID NO: 67)
>Hs.180908_contig1 AA846824|AW611680| AA846182|AA846342| AA846360 poliA = 2 poliA = 3 (SEQ ID NO: 68)
>Hs.89436_mRNA_1 gi|16507959|ref|NM_004063.2 cadherina 17 de Homo sapiens, cadherina LI (hígado del intestino) (CDH 17), ARNm poliA = 1 (SEQ ID NO: 69)
>Hs.151544_mRNA_8 gi|3153107|emb|AL023657.1| HSDSHP ADNc de SH2D1A de Homo sapiens, anteriormente conocido como DSHP poliA = 3 (SEQ iD NO.: 70)
>Hs.1657_contig4
AW473119|AA164586|AI540656|AI758480|AI810941|AI978964|A1675862|AI784397|AW591562|AW514102|AI88811 6|AI983175|AI634735|AI669577|AI202659|AI910598|AI961352|AI565481 |AI886254|AI538838|AA291749|AW571455| AI370308|AI274727|AW473925|AW514787|AI273871|AW470552|AI524356|AI888281|AW089672|AI952766|AW4406 01 |AI654044| AW438839|AI972926 poliA = 2 poliA = 3 (SEQ ID NO: 71)
>Hs.35984_mRNA_1 gi|6049161 |gb|AF 133587.1 |AF 133587 mapa 22q11.2 del cromosoma 22 de Homo sapiens poliA = 3 (SEQ ID NO: 72)
>Hs.334534_mRNA_2 gi|17389403|gb|BC017742.1| BC017742 Homo sapiens, clon IMAGE: 4391536, ARNm poliA = 3 (SEQ ID NO: 73)
5
10
15
20
25
30
35
40
45
50
55
60
65
>Hs.60162_mRNA_1 gi| 10437644|dbj|AK025181.11 AK025181 ADNc de Homo sapiens: FLJ21528 fis, clon C0L05977 poliA = 3 (SEQ ID NO.: 74)
Como se entendería por un experto en la materia, la detección de la expresión de cualquiera de las secuencias anteriormente identificadas, así como las secuencias del conjunto de 90 posterior, o las secuencias proporcionadas en el Listado de Secuencias adjunto pueden realizarse mediante la detección de la expresión de cualquier parte o fragmento apropiado de estas secuencias. Preferentemente, las partes son suficientemente grandes para contener secuencias únicas en relación con otras secuencias expresadas en una muestra que contiene células. Además, el experto en la materia reconocería que las secuencias desveladas representan una cadena de una molécula bicatenaria y que una de las cadenas puede detectarse como un indicador de la expresión de las secuencias desveladas. Esto se entiende porque las secuencias desveladas se expresan como moléculas de ARN en células que se convierten preferentemente a moléculas de ADNc para facilidad de manipulación y detección. Las moléculas de ADNc resultantes pueden tener las secuencias del ARN expresado así como las de la cadena complementaria del mismo. Por lo tanto puede detectarse bien la cadena de secuencia de ARN o bien la cadena complementaria. Por supuesto también es posible detectar el ARN expresado sin conversión a ADNc.
En algunas realizaciones de la invención, los niveles de expresión de secuencias génicas se miden mediante detección de secuencias expresadas en una muestra que contiene células que hibridan con los siguientes oligonucleótidos, que corresponden a las secuencias anteriores como se indica por los números de referencia proporcionados.
>AF133587
CCCGGATCGCCATCAGTGTCATCGAGTTCAAACCCTGAGCCCTTCATTCACCTCTGTGAG (SEQ ID No.: 75). >BC017742
TGCCCTTGCTCTGTGTCATCTCAGTCATTTGACTTAGAAAGTGCCCTTCAAAAGGACCCT (SEQ ID No.: 76) >BF437393
GGAGGGAGGGCTAATTATATATTTTGTTGTTCCTCTATACTTTGTTCTGTTGTCTGCGCC (SEQ ID No.: 77) >AI620495
CAGTTTGGATTGTATAATAACGCCAAGCCCAGTTGTAGTCGTTTGAGTGCAGTAATGAAA (SEQ ID No.: 78) >AK000380
AAAT CAGAGT AACCCTTT CT GT ATTGAGTGCAGT GTTTTTTACT CTTTTCTCAT GCACAT (SEQ ID No.: 79) >BC009237
TGCCTGGCACAAAGAAGGAAGAATATAAATGATAGTTCGACTCGTCTGTGGAAGAACTTA (SEQ ID No.: 80) >BC008765
AGTCTTTTGCTTTTGGCAAAACTCTACTTAATCCAATGGGTTTTTCCCTGTACAGTAGAT (SEQ ID No.: 81) >BC001504
GGTTACTGTGGGTGGAATAGTGGAGGCCTTCAACTGATTAGACAAGGCCCGCCCACATCT (SEQ ID No.: 82) >NM_019894
TAAAATGCACTGCCCTACTGTTGGTATGACTACCGTTACCTACTGTTGTCATTGTTATTA (SEQ ID No.: 83) >BF224381
TT CT CTTTTGGGGGCAAACACT ATGT CCTTTTCTTTTT CT AGAT ACAGTT AATTCCT GGA (SEQ ID No.: 84) >AL157475
AAGACCCACACCCTGTAGCAATACCAAGTGCTATTACATAATCAATGGACGATTTATACT (SEQ ID No.: 85) >AY033998
AGTGTTGCAAGTTTCCTTTAAAACCAACAAAGCCCACAAGTCCTGAATTTCCCATTCTTA (SEQ ID No.: 86) >H07885
GTCACTGTCATAGCAGCTGTGATTTCACAAGGAAGGGTGCTGCAGGGGGACCTGGTTGAT (SEQ ID No.: 87) >NM_004496
TTTCAT CCAGT GTT ATGCACTTTCCACAGTTGGT GTT AGT AT AGCCAGAGGGTTTCATTA (SEQ ID No.: 88) >AA846824
GGGAAGTAGGGATTATTCGTTTAAATTCAATCGCGAGCACCAAGTCGGACTGGCCGGGGA (SEQ ID No.: 89) >BC017586
GGGACCAGGCCCTGGGACAGCCATGTGGCTCCAAATGACTAAATGTCAGCTCAAAAACCA (SEQ ID No.: 90) >AA456140
TCCGTTTATGGAGGCAATTCCATATCCTTTCTTGAACGCACATTCAGCTTACCCCAGAGA (SEQ ID No.: 91) >NM_002283
AGAGTTAAGCCACTTCCTGGGTCTCCTTCTTATGACTGTCTATGGGTGCATTGCCTTCTG (SEQ ID No.: 92) >AL023657
GTGGCCT GAGT AAT GCATT ATGGGTGGTTTACCATTTCTTGAGGT AAAAGCAT CACATGA (SEQ ID No.: 93) >BC001639
ACACAT GCAT GT GT CT GTGT AT GTGTGAATGT GAGAGAGACACAGCCCT CCTTTCAGAAG (SEQ ID No.: 94) >BC015754
TCTGTAACTGCACAACCCTGGGGTTTGCTGCAGAGCTATTTCTTTCCATGTAAAGTAGTG (SEQ ID No.: 95) >AF332224
AAACACT CTTTCCGACTCCAGAGGAGAAGCTGGCAGCT CT CT GT AAGAAAT AT GCT GAT C (SEQ ID No.: 96)
5
10
15
20
25
30
35
40
45
50
55
60
65
>BC001270
GCTTCCTCTATCGCCCAATGCAAAATCGATGAAATGGGGAGTTCTCTGGGCCAGGCCACA (SEQ ID No.: 97) >AI147926
GTAGAATCCTCTGTTCATAATGAACAAGATGAACCAATGTGGATTAGAAAGAAGTCCGAG (SEQ ID No.: 98) >AW298545
CTGTTTTAAAACTGAATGGCACGAAATTGTTTTCCTCAACTCGGAGATTCCTGTATGGAG (SEQ ID No.: 99) >AI802118
AAT AAAT AGTAGCT CT GCTGAT GATGACGTT GAT AACCAAACT GTT CT GT GGT CTTAAGT (SEQ ID No.: 100) >AI683181
CAAACAGCCCGGTCTTGATGCAGGAGAGTCTGGAAAAGGAAGAAAATGGTTTCAGTTTCA (SEQ ID No.: 101) >M95585
AACATGGACCATCCAAATTTATGGCCGTATCAAATGGTAGCTGAAAAAACTATATTTGAG (SEQ ID No.: 102) >AK027147
TT GT AAT CATGCCAATTCCAGAT CAAT AACT GCAT GT CT GTT CTTT GGT AGAAAT AGCTT (SEQ ID No.: 103) >AW291189
AAAGATT ATTAACCCAAAT CACCTTT CTTGCTTACTCCAGAT GCCT CAGCCT CT GAT ATA (SEQ ID No.: 104) >AI632869
GACTTCCTTTAGGAT CT CAGGCTT CT GCAGTT CT CAT GACTCCT ACTTTT CATCCT AGT C (SEQ ID No.: 105) >BC006537
CT GT AT ATTTT GCAAT AGTT ACCT CAAGGCCT ACT GACCAAATT GTT GT GTT GAGAT GAT (SEQ ID No.: 106) >R61469
TGTT CAAACAGACTTTAACCT CT GCAT CATACTT AACCCTGCGACATGCGT ACAGT ATGC (SEQ ID No.: 107) >BC009084
TGAGT CAT AT ACATTTACT GACCACT GTTGCTTGTTGCT CACT GTGCTGCTTTTCCATGA (SEQ ID No.: 108) >N64339
CTGAAATGTGGATGTGATTGCCTCAATAAAGCTCGTCCCCATTGCTTAAGCCTTCAAAAA (SEQ ID No.: 109) >AI200660
AT CAAGAAAACCT AAT CTT CT GACTCCCAGGCCAGGATGTTTTATTTCT CACAT CAT GT C (SEQ ID No.: 110) >AK054605
TTCATTTCCAAACATCATCTTTAAGACTCCAAGGATTTTTCCAGGCACAGTGGCTCATAC (SEQ ID No.: 111) >NM_006115
AGTTAGAAATAGAATCTGAATTTCTAAAGGGAGATTCTGGCTTGGGAAGTACATGTAGGA (SEQ ID No.: 112) >X96757
CAATTTTCTTTTTACT CCCCCT CTT AAGGGGGCCTT GGAAT CT AT AGTAT AGAAT GAACT (SEQ ID No.: 113) >AI804745
GGGTGGAGTTT CAGT GAGAAT AAACGTGT CT GCCTTTGT GT GT GTGT AT AT AT ACAGAGA (SEQ ID No.: 114) >AJ000388
CTCGCTCATTTTTTACCATGTTTTCCAGTCTGTTTAACTTCTGCAGTGCCTTCACTACAC (SEQ ID No.: 115) >BC008764
CTTTGGGCCGAGCACTGAATGTCTTGTACTTTAAAAAAATGTTTCTGAGACCTCTTTCTA (SEQ ID No.: 116) >AI309080
CT GGACCCTT GGAGCAGTGTT GT GT GAACTT GCCT AGAACT CT GCCTT CTCCGTT GT CAA (SEQ ID No.: 117) >AA865917
CCACCTCCTTCGACCTCCACTGCGCCCCACCTCCCTGCCTGTGTGTGTTATTTCAAAGGA (SEQ ID No.: 118) >AA946776
T CTGGCT GGTGGCCT GCGCGAGGGTGCAGT CTT ACTTAAAAGACTTTCAGTTAATT CT CA (SEQ ID No.: 119) >AF104032
AGAT GCT GTCGGCACCAT GTTT ATTT ATTTCCAGT GGT CAT GCT CAGCCTT GCT GCTCTG (SEQ ID No.: 120) >AW194680
TCCTTCCTCTTCGGTGAATGCAGGTTATTTAAACTTTGGGAAATGTACTTTTAGTCTGTC (SEQ ID No.: 121) >BC001293
GTCCTGT CCCT GT CT GGGAGTT GTGTTATTTAAAGAT ATT CTGT ATGTTGT AT CTTTTGC (SEQ ID No.: 122) >BE962007
ATTATATTTCAGGTGTCCTGAACAGGTCACTAGACTCTACATTGGGCAGCCTTTAAATAT (SEQ ID No.: 123) >BI493248
AGGAATGGTACTACCGTTCCAGATTTTCTGTAATTGCTTCTGCAAAGTAATAGGCTTCTT (SEQ ID No.: 124) >AF283645
CT GTACCCAAAGGAT GCCAGAAT ACT AGT ATTTTTATTTATCGT AAACATCCACGAGT GC (SEQ ID No.: 125) >AI669760
ATTGCCCCCCTAACCAATCATGCAAACTTTTCCCCCCCTGGGGTAATTCACCAGTTAAAA (SEQ ID No.: 126) >BC001492
CCCACAGT ATTTAAT GCCCTGT CAGT CCCTT CT AGT CT GACT CAAT GGT AACTT GCTGT A (SEQ ID No.: 127)) >BC004453
AAAACCAACT CT CT ACT ACACAGGCCT GAT AACT CTGT ACGAGGCTT CT CT AACCCCTAG (SEQ ID No.: 128) >BC010626
CT CAGACT GGGCTCCACACT CTTGGGCTT CAGT CT GCCCAT CTGCTGAAT GGAGACAGCA (SEQ ID No.: 129)
5
10
15
20
25
30
35
40
45
50
55
60
65
>BC013117
CCTAATGGGGATTCCTCTGGTTGTTCACTGCCAAAACTGTGGCATTTTCATTACAGGAGA (SEQ ID No.: 130) >BC011949
CACTCACAATTGTTGACTAAAATGCTGCCTTTAAAACATAGGAAAGTAGAATGGTTGAGT (SEQ ID No.: 131) >AW083022
CTTTGAAGGGCTGCTGCACATTGTTGAATCCATCGACCTTTAGCTGCAATGGGATCTCTA (SEQ ID No.: 132) >R08175
T GCCT CATCGAT ATT AT AGGGGTCCAT CACAACCCAACT GT GT GGCCGGATCCT GAGT CT (SEQ ID No.: 133) >NM_000065
AAAACAGACAAAAGCCTTTGCCTTCATGAAGCATACATTCATTCAGGGGTAGACACACAA (SEQ ID No.: 134) >AK025181
TAACAAACAAAGGCAGTAGCTCATCACTTGGGTAGCAGGTACCCATTTTAGGACCCTACA (SEQ ID No.: 135) >NM_003914
AT AT CAGAAGT GCCAAT AATCGT CATAGGCTT CT GCACGTTGGATCAACT AAT GTTGTTT (SEQ ID No.: 136) >AI123582
AT CAT AGCCCAACCAT GTGAGAAGAAGGAGAAGGCCCCCCTTTCTTCATT AAT CT GAAAA (SEQ ID No.: 137) >BC004331
GCAGACCATT CT AT CATACCT GGCAGGGCTT CTGTTTTATTTTGTAGGCT GGAT GCTACC (SEQ ID No.: 138) >AI341378
ACTACAAGCCTCTTGTTTTTCACCAAAACCCTACATCTCAGGCTTACTAATTTTTGTGAT (SEQ ID No.: 139) >NM_004063
GCCATGCATACATGCTGCGCATGTTTTCTTCATTCGTATGTTAGTAAAGTTTTGGTTATT (SEQ ID No.: 140) >BC012926
CACCTATTTATTTTACCTCTTTCCCAAACCTGGAGCATTTATGCCTAGGCTTGTCAAGAA (SEQ ID No.: 141) >AL110274
GTGGACATAGCCACTAACCAACTAGTTACCTTTGGACTGCAACAAAAAATGTGAAAATGA (SEQ ID No.: 142) >AW473119
ACTTGTAAACCTCTTTTGCACTTTGAAAAAGAATCCAGCGGGATGCTCGAGCACCTGTAA (SEQ ID No.: 143) >AI685931
AATTCTCTATAAACGGTTCACCAGCAAACCACCAATACATTCCATTGTTTGCCTAGAGAG (SEQ ID No.: 144) >BF592799
AATGGCCCATGCATGCTGTTTGCAGCAGTCAATTGAGTTGAATTAGAATTCCAACCATAC (SEQ ID No.: 145) >BC000045
GAGCTCAGTACTTGCCCTGTGAAAATCCCAGAAGCCCCCGCTGTCAATGTTCCCCATCCA (SEQ ID No.: 146) >BC015582
ATGAAGCGGAATTAGGCTCCCGAGCTAAGGGACTCGCCTAGGGTCTCACAGTGAGTAGGA (SEQ ID No.: 147)
>M60502
AGTGGCTATATCAACATCAGGGCTAGCACATCTTTCTCTATTATCCTTCTATTGGAATTC (SEQ ID No.: 148)
La invención también proporciona un segundo grupo de 90 secuencias génicas de las que 50 o más pueden usarse en la práctica de la invención. Las 50 a 90 secuencias génicas pueden usarse junto con la determinación de los niveles de expresión de secuencias adicionales siempre que los niveles de expresión de secuencias génicas del conjunto de 90 se usen en clasificación. Un ejemplo no limitante de dichas realizaciones de la invención es cuando la expresión de las 90 secuencias génicas, o al menos 50 (o 50 a aproximadamente 90) miembros de las mismas, se mide junto con los niveles de expresión de una pluralidad de otras secuencias, tal como mediante el uso de una plataforma basada en microarrays usada para realizar la invención. Cuando esos otros niveles de expresión no se usan en la clasificación, se pueden considerar resultados de secuencias transcritas “en exceso” y no críticos para la práctica de la invención. Como alternativa, y cuando esos otros niveles de expresión se usen en clasificación, están dentro del alcance de la invención, cuando el uso de las secuencias anteriormente descritas no excluya necesariamente el uso de niveles de expresión de secuencias adicionales.
38 miembros del conjunto de 90 se incluyen en el primer conjunto de 74 descrito anteriormente. Los números de referencia de estos miembros en común entre los dos con juntos son AA456140, AA846824, AA946776, AF332224, AI620495, AI632869, AI802118, AI804745, AJ000388, AK025181, AK027147, AL157475, AW194680, AW291189, AW298545, AW473119, BC000045, BC001293, BC001504, BC004453, BC006537, BC008765, BC009084, BC011949, BC012926, BC013117, BC015754, BE962007, BF224381, BF437393, BI493248, M60502, NM_000065, NM_ 003914, NM_004063, NM_004496, NM_006115 y R61469. También se proporcionan secuencias de ARNm correspondientes a miembros del conjunto de 90 que no están presentes en el conjunto de 74 secuencias génicas en el listado de secuencias y se identifican como SEQ ID No.: 149-200. El listado de información de identificación para estos 52 miembros únicos por números de referencia, así como secuencias oligonucleotídicas correspondientes que pueden usarse en la práctica de la invención, se proporciona a continuación.
>R15881
ACTTCTGGTGATGATAAAAATGGTTTTATCACCCAGATGTGAAAGAAGCTGCCTGTTTAC (SEQ ID No.: 201)
>AI041545
5
10
15
20
25
30
35
40
45
50
55
60
65
GTGGTTCTGTAAAAACGCAGAGGAAAAGAGCCAGAAGGTTTCTGTTTAATGCATCTTGCC (SEQ ID No.: 202) >NM_024423
TTTATAAGGAAGCAGCTGTCTAAAATGCAGTGGGGTTTGTTTTGCAATGTTTTAAACAGA (SEQ ID No.: 203) >AB038160
CTT AT GAAGCT GGCCGGGCCACT CACGTT CAAT GGT ACAT CT GGGT CT CT AT GT GGTT CT (SEQ ID No.: 204) >AK026790
GTGAGCCAGCATTTCCCATAGCTAACCCTATTCTCTTAGTCTTTCAAAATGTAGAATGGG (SEQ ID No.: 205) >BC012727
CTTTACACCTGATAAAATATTTTGCGAAGAGAGGTGTTCTTTTTCCTTACTGGTGCTGAA (SEQ ID No.: 206) >BC016451
GCAT ACAT CT CAT CCACAGGGGAAGAT AAAGAT GGT CACACAAACAGTTTCCAT AAAGAT (SEQ ID No.: 207) >H09748
TGAGTTCAGCATGTGTCTGTCCATTTCATTTGTACGCTTGTTCAAAACCAAGTTTGTTCT (SEQ ID No.: 208) >NM_006142
AAGACCGAGACTGAGGGAAAGCATGTCTGCTGGGTGTGACCATGTTTCCTCTCAATAAAG (SEQ ID No.: 209) >AF191770
GGCAT CT GGCCCCT GGT AGCCAGCT CTCCAGAATT ACTTGT AGGTAATTCCT CT CTT CAT (SEQ ID No.: 210) >NM_006378
TGGATGTTTGTGCGCGTGTGTGGACAGTCTTATCTTCCAGCATGATAGGATTTGACCATT (SEQ ID No.: 211) >BC006819
TCCTGGCAGAGCCATGGTCCCAGGCTTCCCAAAAGTGTTTGTGGCAATTATTCCCCTAGG (SEQ ID No.: 212) >X79676
TTTGATGATAGCAGACATTGTTACAAGGACATGGTGAGTCTATTTTTAATGCACCAATCT (SEQ ID No.: 213) >BC006811
TT CTTCCAGTT GCACT ATT CT GAGGGAAAAT CT GACACCT AAGAAATTT ACT GT GAAAAA (SEQ ID No.: 214) >NM_000198
GAACAATTGTGGT CT CT CTTAACTTGAGGTT CT CTTTTGACT AAT AGAGCTCCATTTCCC (SEQ ID No.: 215) >AF301598
GTT AAGTGTGGCCAAGCGCACGGCGGCAAGTTTT CAAGCACT GAGTTT CT ATT CCAAGAT (SEQ ID No.: 216) >NM_002847
CGGCCT ACTGAGCGGACAGAAT GATGCCAAAAT ATTGCTT ATGT CT CT ACATGGT ATTGT (SEQ ID No.: 217) >NM_004062
CAGGGT GTTTGCCCAAT AAT AAAGCCCCAGAGAACTGGGCT GGGCCCT AT GGGATT GGT A (SEQ ID No.: 218)
>AW118445
TGT ACAGTTTGGTTGTTGCT GT AAAT AT GGT AGCGTTTTGTT GTTGTTGTTTTTTCAT GC (SEQ ID No.: 219) >BC002551
TACCAAACTGGGACTCACAGCTTTATTGGGCTTTCTTTGTGTCTTGTGTGTTTCTTTTAT (SEQ ID No.: 220) >AA765597
CATT GAGGTTT GGAT GGTGGCAGGT AAAACAGAAAGGCAAGAT GT CAT CT GACATT AGGC (SEQ ID No.: 221) >AL137761
AGTTCAGCACTGTGGTTATCATTGGTGATGCCAGAAAACATTAGTAGACTTAGACAATTG (SEQ ID No.: 222) >X78202
TAAAATTTCTTGATTGTGACTATGTGGTCATATGCCCGTGTTTGTCACTTACAAAAATGT (SEQ ID No.: 223) >AK025615
AGCCAT CT GGT GTGAAGAACT CT AT ATTTGT AT GTTGAGAGGGCAT GGAAT AATTGTATT (SEQ ID No.: 224) >BC001665
CTTATTGTCACTGGTTAAGAACTTGGCGAGATTGAAGGGCTTTTGTTATTGTTGTTGGAT (SEQ ID No.: 225) >AI985118
CTTT CT AGT GAGCT AACCGT AACAGAGAGCCT ACAGGAT ACACGT GAGAT AAT GT CACGT (SEQ ID No.: 226) >AL039118
TTGTCTTAAAATTTCTTGATTGTGATACTGTGGTCATATGCCCGTGTTTGTCACTTACAA (SEQ ID No.: 227) >AA782845
CCTGGGGGAAAGGGGCATTCATGACCTGAACTTTTTAGCAAATTATTATTCTCAGTTTCC (SEQ ID No.: 228) >BC016340
TTCATTAACAGTACTAAGTGGAAGGGATCTGCAGATTCCAAATTGGAATAAGCTCTATCA (SEQ ID No.: 229) >AA745593
CCAAT GCAGAAGAGT ATT AAGAAAGAT GCT CAAGTCCCAT GGCACAGAGCAAGGCGGGCA (SEQ ID No.: 230)
>NM_004967
CAAGGCTACGATGGCTATGATGGTCAGAATTACTACCACCACCAGTGAAGCTCCAGCCTG (SEQ ID No.: 231) >BF510316
AGCT CACAGCT GGACAGGT GTT GT AT ATAGAGT GGAAT CT CTT GGAT GCAGCTT CAAGAA (SEQ ID No.: 232) >AA993639
TCCAAAGT AGAAAGGGTTCTTTTAGAAAACTTGAAGAATGT GCCTCCT CTT AGCAT CT GT (SEQ ID No.: 233) >AV656862
5
10
15
20
25
30
35
40
45
50
55
60
65
GATGCATTTTTCAGTCCCTTTTCAGAGCAAATGCTTTTGCAATGGTAGTAATGTTTAGTT (SEQ ID No.: 234) >X69699
CCTGTGGGGCTTCTCTCCTTGATGCTTCTTTCTTTTTTTAAAGACAACCTGCCATTACCA (SEQ ID No.: 235) >BC013282
TTGCACTAAGTCATGCTGTTTCCTCAAAGAAGCTTTGTTTTTTGTTAACGTATTACTCAG (SEQ ID No.: 236) >AI457360
CTGGATCCCAGGCCCTGGCACCCCTCAGGAAATACAAGAAAAAGAATATTCACATCTGTT (SEQ ID No.: 237) >AW445220
TTAGAGGGGCCACCTATCAACTCATCAGTGTTCAAAGAATATGCTGGGAGCATGGGTGAG (SEQ ID No.: 238) >AF038191
GGCCCATTTATGTCCCT CATGT CT CT AGATTTTCT CGTCACCCAGCCT CAAAAAT ATATG (SEQ ID No.: 239) >X05615
TCCCCAAAAACCT CACCCGAGGCT GCCCACT AT GGTCAT CTTTTT CT CT AAAATAGTTAC (SEQ ID No.: 240) >BC005364
GAAATTCCTCACACCTTGCACCTTCCCTACTTTTCTGAATTGCTATGACTACTCCTTGTT (SEQ ID No.: 241) >AK025701
T GT CT GTCCACCACGAGAT GGGAGGAGGAGAAAAAGCGGT ACGAT GCCTTCCT GACCT CA (SEQ ID No.: 242)
>BF446419
GT CTT AT CT CT CAGGGGGGGTTT AAGT GCCGTTTGCAAT AATGT CGTCTT ATTT ATTT AG (SEQ ID No.: 243) >AK025470
CCGAGTAGTATGGGTCTCTGTGTGAGAAACCAGGAGATATTTTCATCTTGTTCGGAAATA (SEQ ID No.: 244) >BE552004
TTGTGCAAAAGTCCCACAACCTTTCTGGATTGATAGTTTGTGGTGAAATAAACAATTTTA (SEQ ID No.: 245) >H05388
TCCAGTATTCTGCAGGGCCAGTCAGTTGTACAGAAGTTGGAATATTCTGTTCCAGAATTA (SEQ ID No.: 246) >NM_033229
GTCTCGAACAGCGGTTGTTTTTACTTTATTTATCTTAGGCCCTCAGCTCCCTGACGTCCT (SEQ ID No.: 247) >BC010437
AGT GAAT CTTTTCCT CTT GGT AGCAT CAACACT GGGGAT AAAT CAGAACCATT CT GTGGA (SEQ ID No.: 248) >AI952953
TGAGAGCCCAGAACAAGAAGGAGCAGAAGGGCACTTTGACCTTCATTATTATGAAAATCA (SEQ ID No.: 249) >R45389
GGAAGAACTGATGCTTGCTGCTAACTAAAGTTTTGGATGTATCGATTTAGAGAACCAATT (SEQ ID No.: 250) >NM_001337
GAAT GAGAGAAT AAGT CATGTTCCTT CAAGAT CAT GT ACCCCAATTTACTTGCCATTACT (SEQ ID No.: 251) >AI499593
TACGGAAAGGAAACAGGTTATACTCTTAGATTTAAAAAGTGAAAGAAACTGCAGGCGCCT (SEQ ID No.: 252)
En algunas realizaciones de la invención, los niveles de expresión de secuencias génicas se miden por detección de secuencias expresadas en una muestra que contienen células que hibridan con los oligonucleótidos anteriores, que corresponden a las secuencias en el listado de secuencias como se indica por los números de referencia proporcionados.
En realizaciones adicionales, la invención posibilita el uso de cualquier variedad de secuencias génicas del conjunto de 74 o el conjunto de 90 en los métodos de la invención. Por lo tanto, de 1 a las 50 o más secuencias génicas usadas en la invención pueden ser de uno o ambos de los conjuntos anteriores. Por lo tanto, de uno, dos, tres, cuatro, cinco, seis, siete, ocho, nueve, diez o más de las 50 o más secuencias pueden ser del conjunto de 74 o del conjunto de 90.
Como se usa en el presente documento, una “muestra tumoral” o “muestra que contiene tumor” o “muestra que contiene células tumorales” o variaciones de las mismas, se refieren a muestras que contienen células de tejido o fluido aislado de un individuo que se sospecha que está aquejado de, o en riesgo de desarrollar, cáncer. Las muestras pueden contener células tumorales que pueden aislarse por métodos conocidos u otros métodos apropiados según se considere deseable por el practicante experto. Estos incluyen, pero sin limitación, microdisección, microdisección de captura por láser (LCM) o microdisección por láser (lMd) antes de su uso en la presente invención. Como alternativa, pueden usarse células no disecadas dentro de una “sección” de tejido. Los ejemplos no limitantes de dichas muestras incluyen aislados primarios (a diferencia de células cultivadas) y pueden recogerse por cualquier medio no invasivo o mínimamente invasivo, incluyendo, pero sin limitación, lavado ductal, aspiración con aguja fina, biopsia con aguja, los dispositivos y métodos descritos en la Patente de Estados Unidos 6.328.709, o cualquier otro medio adecuado reconocido en la técnica. Como alternativa, la muestra puede recogerse por un método invasivo, incluyendo, pero sin limitación, biopsia quirúrgica.
La detección y medición de secuencias transcritas puede conseguirse por una diversidad de medios conocidos en la técnica o según se considere apropiado por el practicante experto. Esencialmente, puede usarse cualquier método de ensayo siempre que el ensayo refleje, cuantitativa o cualitativamente, la expresión de la secuencia transcrita que
5
10
15
20
25
30
35
40
45
50
55
60
65
se detecta.
La capacidad de clasificar muestras tumorales se proporciona por el reconocimiento de la relevancia del nivel de expresión de las secuencias génicas (bien seleccionadas aleatoriamente o bien específicas) y no por la forma del ensayo usado para determinar el nivel real de expresión. Un ensayo de la invención puede utilizar cualquier característica identificativa de una secuencia génica individual como se desvela en el presente documento siempre que el ensayo refleje, cuantitativa o cualitativamente, la expresión del gen en el “transcriptoma” (la fracción transcrita de genes en un genoma) o el “proteoma” (la fracción traducida de genes expresados en un genoma). Los ensayos adicionales incluyen los basados en la detección de fragmentos polipeptídicos del miembro o los miembros relevantes del proteoma. Los ejemplos no limitantes de este último incluyen detección de fragmentos proteolíticos hallados en un fluido biológico, tal como sangre o suero. Las características identificativas incluyen, pero sin limitación, secuencias de ácido nucleico únicas usadas para codificar (ADN) o expresar (ARN), dicho gen o epítopos específicos de, o actividades de, una proteína codificada por una secuencia génica.
Los medios adicionales incluyen detección de la amplificación de ácido nucleico como indicación de niveles de expresión aumentados e inactivación, detección o metilación de ácidos nucleicos, como indicación de los niveles de expresión reducidos. Dicho de otro modo, la invención puede practicarse ensayando uno o más aspectos del molde o los moldes de ADN que subyacen a la expresión de cada secuencia génica, del ARN usado como un intermedio para expresar la secuencia, o del producto proteico expresado por la secuencia, así como fragmentos proteolíticos de dichos productos. Como tal, la detección de la presencia de, cantidad de, estabilidad de, o degradación (incluyendo tasa) de, dichas moléculas de ADN, ARN y proteicas puede usarse en la práctica de la invención.
En algunas realizaciones, toda o parte de una secuencia génica puede amplificarse y detectarse por métodos tales como la reacción en cadena de la polimerasa (PCR) y variaciones de la misma, tal como, pero sin limitación, PCR cuantitativa (Q-PCR), PCR de transcripción inversa (RT-PCR) y PCR en tiempo real (incluyendo como medio para medir las cantidades iniciales de copias de ARNm para cada secuencia en una muestra), opcionalmente RT-PCR en tiempo real o Q-PCR en tiempo real. Dichos métodos utilizarían uno o dos cebadores que son complementarios de partes de una secuencia génica, cuando se usen los cebadores para iniciar la síntesis de ácido nucleico. Los ácidos nucleicos de nueva síntesis se marcan opcionalmente y pueden detectarse directamente o mediante hibridación con un polinucleótido de la invención. Los ácidos nucleicos de nueva síntesis pueden ponerse en contacto con polinucleótidos (que contienen secuencias génicas) de la invención en condiciones que permitan su hibridación. Los métodos adicionales para detectar la expresión de ácidos nucleicos expresados incluyen ensayos de protección de RNAsa, incluyendo hibridaciones de fase líquida, e hibridación de células in situ.
Como alternativa, la expresión de secuencias génicas en muestras de FFPE puede detectarse como se desvela en las Solicitudes de Estados Unidos 60/504.087, presentada el 19 de septiembre de 2003, 10/727.100, presentada el 2 de diciembre de 2003 y 10/773.761, presentada el 6 de febrero de 2004. Brevemente, la expresión de toda o una parte de una secuencia génica expresada o transcrito puede detectarse mediante el uso de detección mediada por hibridación (tal como, pero sin limitación, microarray, perla o tecnología basada en partículas) o detección mediada por PCR cuantitativa (tal como, pero sin limitación, PCR en tiempo real y PCR de transcriptasa inversa) como ejemplos no limitantes. La expresión de todo o una parte de un polipéptido expresado puede detectarse mediante el uso de técnicas de inmunohistoquímica u otra detección mediada por anticuerpos (tal como, pero sin limitación, uso de anticuerpos marcados que se unen específicamente con al menos parte del polipéptido en relación con otros polipéptidos) como ejemplos no limitantes. Estás disponibles medios adicionales para análisis de la expresión génica, incluyendo detección de la expresión dentro de un ensayo para expresión génica global, o casi global, en una muestra (por ejemplo como parte de un análisis de perfil de expresión génica tal como en un microarray). Son ejemplos no limitantes amplificación de ARN lineal y los descritos en la Solicitud de Patente de Estados Unidos 10/062.857 (presentada el 25 de octubre de 2001), así como las solicitudes de Patente Provisional de Estados Unidos 60/298.847 (presentada el 15 de junio de 2001) y 60/257.801 (presentada el 22 de diciembre de 2000).
En realizaciones usando un ensayo basado en ácido nucleico para determinar la expresión se incluye la inmovilización de una o más secuencias génicas en un soporte sólido, incluyendo, pero sin limitación, un sustrato sólido como una matriz o con perlas o tecnología basada en perlas como se conoce en la técnica. Como alternativa, también pueden usarse ensayos de expresión basados en solución conocidos en la técnica. La secuencia o las secuencias génicas inmovilizadas pueden estar en forma de polinucleótidos que son únicos o de otro modo específicos para el gen o los genes de modo que los polinucleótidos serían capaces de hibridar con el ADN o ARN de dicho gen o dichos genes. Estos polinucleótidos pueden ser la longitud completa del gen o los genes o ser secuencias cortas de los genes (hasta un nucleótido más cortas que la secuencia de longitud completa conocida en la técnica por deleción del extremo 5' o 3' de la secuencia) que están opcionalmente mínimamente interrumpidas (tal como por desapareamientos o pares de bases no complementarios insertados) de modo que no se ve afectada la hibridación con un ADN o ARN correspondiente a los genes. En algunas realizaciones, los polinucleótidos usados son del extremo 3' del gen, tal como a una distancia de aproximadamente 350, aproximadamente 300, aproximadamente 250, aproximadamente 200, aproximadamente 150, aproximadamente 100 o aproximadamente 50 nucleótidos desde la señal de poliadenilación o el sitio de poliadenilación de un gen o secuencia expresada. Los polinucleótidos que contienen mutaciones en relación con las secuencias de los genes desvelados también pueden usarse siempre que la presencia de las mutaciones aún permite la hibridación para producir una señal detectable.
5
10
15
20
25
30
35
40
45
50
55
60
65
Por lo tanto la práctica de la presente invención no se ve afectada por la presencia de desapareamientos menores entre las secuencias desveladas y las expresadas por células de una muestra de un sujeto. Un ejemplo no limitante de la existencia de dichos desapareamientos se ve en casos de polimorfismos de secuencia entre individuos de una especie, tal como pacientes humanos individuales dentro de Homo sapiens.
Como se apreciará por los expertos en la materia, algunas secuencias génicas incluyen tramos 3' poli A (o poli T en la cadena complementaria) que no contribuyen a la singularidad de las secuencias desveladas. La invención puede practicarse por lo tanto con secuencias génicas que carecen de los tramos 3' poli A (o poli T). La singularidad de las secuencias desveladas se refiere a las partes o totalidades de las secuencias que se encuentran solamente en ácidos nucleicos, incluyendo secuencias únicas halladas en la parte no traducida 3' de los mismos. Algunas secuencias únicas para la práctica de la invención son las que contribuyen a las secuencias consenso para los genes de modo que las secuencias únicas sean útiles en la detección de la expresión en una diversidad de individuos en lugar de ser específicas para un polimorfismo presente en algunos individuos. Como alternativa, pueden usarse secuencias únicas de un individuo o una subpoblación. Las secuencias únicas pueden ser los tramos de polinucleótidos de la invención como se describe en el presente documento.
En realizaciones adicionales de la invención, se usan polinucleótidos que tienen secuencias presentes en las regiones 3' no traducidas y/o no codificantes de secuencias génicas para detectar los niveles de expresión en muestras que contienen células de la invención. Dichos polinucleótidos pueden contener opcionalmente secuencias halladas en las partes 3' de las regiones codificantes de secuencias génicas. Los polinucleótidos que contienen una combinación de secuencias de las regiones codificantes y 3' no codificantes preferentemente tienen las secuencias dispuestas de forma contigua, sin una secuencia o secuencias heterólogas intermedias.
Como alternativa, la invención puede practicarse con polinucleótidos que tienen secuencias presentes en las regiones 5' no traducida y/o no codificantes de secuencias génicas para detectar el nivel de expresión en células y muestras de la invención. Dichos polinucleótidos pueden opcionalmente contener secuencias halladas en las partes 5' de las regiones codificantes. Los polinucleótidos que contienen una combinación de secuencias de las regiones codificantes y 5' no codificantes pueden tener las secuencias dispuestas de forma contigua, sin secuencia o secuencias heterólogas intermedias. La invención también puede practicarse con secuencias presentes en las regiones codificantes de secuencias génicas.
Los polinucleótidos de algunas realizaciones contienen secuencias de regiones 3' o 5' no traducidas y/o no codificantes de al menos aproximadamente 16, al menos aproximadamente 18, al menos aproximadamente 20, al menos aproximadamente 22, al menos aproximadamente 24, al menos aproximadamente 26, al menos aproximadamente 28, al menos aproximadamente 30, al menos aproximadamente 32, al menos aproximadamente 34, al menos aproximadamente 36, al menos aproximadamente 38, al menos aproximadamente 40, al menos aproximadamente 42, al menos aproximadamente 44, o al menos aproximadamente 46 nucleótidos consecutivos. El término “aproximadamente” como se usa en la frase anterior se refiere a un aumento o una reducción de uno desde el valor numérico indicado. Otras realizaciones usan polinucleótidos que contienen secuencias de al menos o aproximadamente 50, al menos o aproximadamente 100, al menos aproximadamente o 150, al menos o aproximadamente 200, al menos o aproximadamente 250, al menos o aproximadamente 300, al menos o aproximadamente 350 o al menos o aproximadamente 400 nucleótidos consecutivos. El término “aproximadamente” como se usa en la frase precedente se refiere a un aumento o una reducción del 10 % desde el valor numérico indicado.
Las secuencias desde el extremo 3' o 5' de regiones codificantes de genes como se encuentran en polinucleótidos de la invención son de las mismas longitudes que las descritas anteriormente, excepto que estarían limitadas de forma natural por la longitud de la región codificante. El extremo 3' de una región codificante puede incluir secuencias hasta la mitad 3' de la región codificante. Por el contrario, el extremo 5' de la región codificante pueden incluir secuencias hasta la mitad 5' de la región codificante. Por supuesto las secuencias anteriormente descritas, o las regiones codificantes y polinucleótidos que contienen partes de las mismas, pueden usarse en su totalidad.
En otra realización de la invención, pueden usarse polinucleótidos que contiene deleciones de nucleótidos del extremo 5' y/o 3' de secuencias génicas. Las deleciones son preferentemente de 1-5, 5-10, 10-15, 15-20, 20-25, 2530, 30-35, 35-40, 40-45, 45-50, 50-60, 60-70, 70-80, 80-90, 90-100, 100-125, 125-150, 150-175 o 175-200 nucleótidos desde el extremo 5' y/o 3', aunque el alcance de las deleciones estaría limitado de forma natural por la longitud de las secuencias y la necesidad de poder usar los polinucleótidos para la detección de niveles de expresión.
Otros polinucleótidos de la invención del extremo 3' de secuencias génicas incluyen los de cebadores y sondas opcionales para PCR cuantitativa. Preferentemente, los cebadores y sondas son los que amplifican una región de menos de menos de aproximadamente 750, menos de aproximadamente 700, menos de aproximadamente 650, menos de aproximadamente 6000, menos de aproximadamente 550, menos de aproximadamente 500, menos de aproximadamente 450, menos de aproximadamente 400, menos de aproximadamente 350, menos de
aproximadamente 300, menos de aproximadamente 250, menos de aproximadamente 200, menos de
aproximadamente 150, menos de aproximadamente 100 o menos de aproximadamente 50 nucleótidos desde la
5
10
15
20
25
30
35
40
45
50
55
60
65
señal de poliadenilación o el sitio de poliadenilación de un gen o secuencia expresada. El tamaño de un amplicón de PCR de la invención puede ser de cualquier tamaño, incluyendo al menos o aproximadamente 50, al menos o aproximadamente 100, al menos aproximadamente o 150, al menos o aproximadamente 200, al menos o aproximadamente 250, al menos o aproximadamente 300, al menos o aproximadamente 350, o al menos o aproximadamente 400 nucleótidos consecutivos, todos con inclusión de la parte complementaria de los cebadores de PCR usados.
Otros polinucleótidos para uso en la práctica de la invención incluyen los que tienen suficiente homología con secuencias génicas para detectar su expresión mediante el uso de técnicas de hibridación. Dichos polinucleótidos tienen preferentemente aproximadamente o 95 %, aproximadamente o 96 %, aproximadamente o 97 %, aproximadamente o 98 %, o aproximadamente o 99 % de identidad con las secuencias génicas para usar. La identidad se determina usando el algoritmo de BLAST, como se ha descrito anteriormente. Los otros polinucleótidos para uso en la práctica de la invención también pueden describirse basándose en la capacidad de hibridar con polinucleótidos de la invención en condiciones rigurosas de aproximadamente 30 % v/v hasta aproximadamente 50 % de formamida y de aproximadamente 0,01 M a aproximadamente 0,15 M de sal para hibridación y de aproximadamente 0,01 M a aproximadamente 0,15 M de sal para condiciones de lavado de aproximadamente 55 a aproximadamente 65 °C o más, o condiciones equivalentes a las mismas.
En una realización adicional de la invención, se proporciona una población de moléculas de ácido nucleico monocatenarias que comprenden una o ambas cadenas de una secuencia génica humana como una sonda de modo que al menos una parte de dicha población pueda hibridarse con una o ambas cadenas de una molécula o ácido nucleico amplificada de forma cuantitativa a partir de ARN de una célula o muestra de la invención. La población puede ser solamente la cadena antisentido de una secuencia génica humana de modo que una cadena con sentido de una molécula de, o amplificada a partir de, una célula puede hibridarse con una parte de dicha población. La población comprende preferentemente una cantidad suficientemente en exceso de dichas una o ambas cadenas de una secuencia génica humana en comparación con la cantidad de moléculas de ácido nucleico expresadas (o amplificadas) que contienen una secuencia génica complementaria.
La invención proporciona además un método para clasificar una muestra tumoral humana detectando los niveles de expresión de 50 o más secuencias transcritas en un ácido nucleico o muestra que contiene células obtenida de un sujeto humano, y clasificando la muestra como que contiene una célula tumoral de un tipo tumoral hallado en seres humanos excluyendo uno o más tipos tumorales humanos distintos. En algunas realizaciones, el método puede usarse para clasificar una muestra que es, o tiene células de, uno de los 53 tipos tumorales enumerados anteriormente excluyendo uno o más de los otros 52. En otras realizaciones, el método se usa para clasificar una muestra que es, o tiene células de, uno de los 34 tipos tumorales enumerados anteriormente excluyendo uno o más de los otros 33 tipos tumorales. En realizaciones adicionales, el método se usa para clasificar una muestra que es, o tiene células de, uno de los 39 tipos tumorales enumerados anteriormente excluyendo uno o más de los otros 38 tipos tumorales.
La invención también proporciona un método para clasificar muestras tumorales como de un subconjunto de los posibles tipos tumorales descritos en el presente documento detectando los niveles de expresión de 50 o más secuencias transcritas en una muestra tumoral que contiene ácido nucleico obtenida de un sujeto humano, y clasificando la muestra como de varios tipos tumorales hallados en seres humanos excluyendo uno o más otros tipos tumorales humanos. En algunas realizaciones de la invención, el número de otros tipos tumorales es de 1 a aproximadamente 3, más preferentemente de 1 a aproximadamente 5, de 1 a aproximadamente 7, o de 1 a aproximadamente 9 o aproximadamente 10. En otras realizaciones, los varios tipos tumorales son todos del mismo origen tisular u orgánico tal como los enumerados anteriormente. Este aspecto de la invención está relacionado con el análisis anterior de la Figura 8 y de intercambiar especificidad en favor de confianza aumentada, y puede aplicarse provechosamente a situaciones en las que la clasificación de una muestra como un único tipo tumoral está a un nivel de precisión o rendimiento que puede mejorarse clasificando la muestra como una de un subconjunto de posibles tipos tumorales.
En realizaciones adicionales, la invención puede practicarse analizando la expresión génica a partir de células individuales o poblaciones celulares homogéneas que se han diseccionado de, o se han aislado o purificado de otro modo de, células contaminantes de una muestra presentes en una biopsia sencilla. Una ventaja proporcionada por estas realizaciones es que pueden retirarse células no tumorales, contaminantes, (tales como linfocitos de infiltración u otras células del sistema inmunitario) para que no afecten a los genes identificados o el análisis posterior de los niveles de expresión génica como se proporciona en el presente documento. Dicha contaminación está presente cuando se usa una biopsia para generar perfiles de expresión génica.
En realizaciones adicionales de la invención que utilizan Q-PCR o Q-PCR de transcriptasa inversa como la plataforma de ensayo, los niveles de expresión de secuencias génicas de la invención pueden compararse con los niveles de expresión de genes de referencia en la misma muestra o puede usarse una relación de niveles de expresión. Esto proporciona una media para “normalizar” los datos de expresión para comparación de datos en una pluralidad de tipos tumorales conocidos y una muestra que contiene células para ensayar. Aunque puede usarse una diversidad de genes de referencia, la invención también puede practicarse con el uso de 8 secuencias génicas
5
10
15
20
25
30
35
40
45
50
55
60
65
de referencia particulares que se identificaron para su uso con el conjunto de 39 tipos tumorales. Además, la Q-PCR puede realizarse completa o en parte con el uso de un formato múltiple.
Se proporcionan secuencias de ARNm correspondientes a las 8 secuencias de referencia en el Listado de Secuencias adjunto. Se proporciona a continuación un listado de las SEQ ID Nos. correspondientes, con información de identificación correspondiente, incluyendo números de referencia y otra información.
>Hs.77031_mRNA_1 gi|16741772|gb|BC016680.1 |BC016680 clon de Homo sapiens MGC:21349 IMAGE:4338754 poliA=3 (SEQ ID No.: 253)
>Hs.77541_mRNA_1 gi|12804364|gb|BC003043.1 |BC003043 clon de Homo sapiens MGC:4370 IMAGE:2822973 poliA=3 (SEQ ID No.: 254)
>Hs.7001_mRNA_1 gi|6808256|emb|AL137727.1|HSM802274 ARNm de Homo sapiens; ADNc DKFZp434M0519 (del clon DKFZp434M0519); cds parcial poliA=3 (SEQ ID No.: 255)
>Hs.302144_mRNA_1 gi|11493400|gb|AF130047.1|AF130047 clon de Homo sapiens FLB3020 poliA=0 (SEQ ID No.: 256)
>Hs.26510_mRNA_2 gi|11345385|gb|AF308803.1 |AF308803 mapa 15q26 de cromosoma 15 de Homo sapiens poliA=3 (SEQ ID No.: 257)
>Hs.324709_mRNA_2 gi|12655026|gb|BC001361.1|BC001361 clon de Homo sapiens MGC:2474 IMAGE:3050694 poliA=2 (SEQ ID No.: 258)
>Hs.65756_mRNA_3 gi|3641494|gb|AF035154.1|AF035154 mapa 16p13.3 de cromosoma 16 de Homo sapiens poliA=3 (SEQ ID No.: 259)
>Hs.165743_mRNA_2 gi|13543889|gb|BC006091.1|BC006091 clon de Homo sapiens MGC:12673 IMAGE:3677524 poliA=3 (SEQ ID No.: 260)
La detección de la expresión de cualquiera de las secuencias de referencia anteriores puede ser por la misma metodología o una diferente que para las otras secuencias génicas descritas anteriormente. En algunas realizaciones de la invención, los niveles de expresión de secuencias génicas se miden mediante la detección de que secuencias expresadas en una muestra que contiene células hibridan con los siguientes oligonucleótidos, que corresponden a las secuencias anteriores como se indica por los números de referencia proporcionados.
>BC006091
TCATCTTCACCAAACCAGTCCGAGGGGTCGAAGCCAGACACGAGAGGAAGAGGGTCCTGG (SEQ ID No.: 261)
>BC003043
CTCTGCTCCTGCTCCTGCCTGCATGTTCTCTCTGTTGTTGGAGCCTGGAGCCTTGCTCTC (SEQ ID No.: 262) >AF130047
TGCTCCCGGCTGTCCTCCTCTCCTCTTCCCTAGTGAGTGGTTAATGAGTGTTAATGCCTA (SEQ ID No.: 263) >AF035154
CCCCAT CT CT AAAACCAGTAAAT CAGCCAGCGAAT ACCCGGAAGCAAGAT GCACAGGCGG (SEQ ID No.:
264)
>BC001361
CCAGAAACAAGGAAGAGGAAAGACAAAGGGAAGGGACGGGAGCCCTGGAGAAGCCCGACC (SEQ ID No.:
265)
>AF308803
AAGT ACAACCCAT GCT GCT AAGAT GCGAGCAGGAAGAGGCATCCTTTGCT AAATCCT GTT (SEQ ID No.: 266) >BC016680
ACCTCACCCCTGCCCGGCCCAAGCTCTACTTGTGTACAGTGTATATTGTATAATAGACAA (SEQ ID No.: 267) >AL137727
TTCCCTTAATTCCTCCTCCCGACCTTTTTTACCCCCCCAGTTGCAGTATTTAACTGGGCT (SEQ ID No.: 268)
En un aspecto adicional, los métodos proporcionados por la presente invención pueden también ser automáticos completamente o en parte. Esto incluye la realización de la invención en software. Los ejemplos no limitantes incluyen instrucciones ejecutables por procesador en uno o más dispositivos de almacenamiento leíbles por ordenador en los que dichas instrucciones dirigen la clasificación de muestras tumorales basándose en los niveles de expresión génica como se describe en el presente documento. Se contemplan instrucciones ejecutables por procesador adicionales en uno o más dispositivos de almacenamiento leíbles por ordenador en los que dichas instrucciones provocan representación y/o manipulación, mediante un dispositivo de salida informático, del proceso o resultados de un método de clasificación.
La invención incluye realizaciones de software y hardware en las que los datos de expresión génica de un conjunto de secuencias génicas en una pluralidad de tipos tumorales conocidos se realizan como un conjunto de datos. En algunas realizaciones, los datos de expresión génica se usan para la práctica de un método de la invención. La invención también proporciona medios relacionados con ordenador y sistemas para realizar los métodos desvelados en el presente documento. En algunas realizaciones, se proporciona un aparato para clasificar una muestra que contiene células. Dicho aparato puede comprender una entrada de consulta configurada para recibir un almacenamiento de consulta configurado para almacenar un conjunto de datos de expresión génica, como se describe en el presente documento, recibidos de una entrada de consulta; y un módulo para acceder a y usar datos
5
10
15
20
25
30
35
40
45
50
55
60
65
del almacenamiento en un algoritmo de clasificación como se describe en el presente documento. El aparato puede comprender además un almacenamiento en cadena para los resultados del algoritmo de clasificación, opcionalmente con un módulo para acceder y usar datos del almacenamiento en cadena en un algoritmo de salida como se describe en el presente documento.
Las etapas de un método, proceso o algoritmo descrito en relación con las realizaciones desveladas en el presente documento pueden realizarse directamente en hardware, en un módulo de software ejecutado por un procesador, o en una combinación de los dos. Las diversas etapas o actos en un método o proceso pueden realizarse en el orden mostrado, o pueden realizarse en otro orden. Adicionalmente, una o más etapas del proceso o método pueden omitirse o una o más etapas del proceso o método pueden añadirse a los métodos y procesos. Puede añadirse una etapa, bloque o acción adicional al comienzo, final o entre elementos existentes de los métodos y procesos.
Un aspecto adicional de la invención posibilita el uso de la presente invención en relación con actividades clínicas. En algunas realizaciones, la determinación o medición de la expresión génica como se describe en el presente documento se realiza como parte de la provisión de cuidado médico a un paciente, incluyendo la provisión de servicios de diagnóstico en apoyo de la provisión de cuidado médico. Por lo tanto la invención incluye un método en el cuidado médico de un paciente, comprendiendo el método determinar o medir los niveles de expresión de secuencias génicas en una muestra que contiene células obtenidas de un paciente como se describe en el presente documento. El método puede comprender además la clasificación de la muestra, basándose en la determinación/medición, como que incluye una célula tumoral de un tipo u origen tisular tumoral de una manera descrita en el presente documento. La determinación y/o clasificación puede ser para su uso en relación con cualquiera aspecto o realización de la invención como se describe en el presente documento.
La determinación o medición de los niveles de expresión puede precederse de una diversidad de acciones relacionadas. En algunas realizaciones, la medición se precede de una determinación o diagnóstico de un sujeto humano como necesitado de dicha medición. La medición puede precederse de una determinación de la necesidad de la medición, tal como por un doctor en medicina, enfermero u otro proveedor o profesional de cuidados sanitarios, o los que trabajan bajo sus instrucciones, o personal de una organización de mantenimiento o aseguradora de salud al aprobar la realización de la medición como una base para pedir el reembolso o pago de la realización.
La medición también puede precederse de actos preparatorios necesarios para la medición en sí. Los ejemplos no limitantes incluyen la propia obtención de una muestra que contiene células de un sujeto humano; o recepción de una muestra que contiene células; o sección de una muestra que contiene células; o aislamiento de células de una muestra que contiene células; u obtención de ARN a partir de células de una muestra que contiene células; o transcripción inversa de ARN a partir de células de una muestra que contiene células. La muestra puede ser cualquiera como se describe en el presente documento para la práctica de la invención.
En realizaciones adicionales, la invención posibilita un método para pedir, o recibir un pedido de, la realización de un método en el cuidado médico de un paciente u otro método de la invención. La petición puede realizarse por un doctor en medicina, un enfermero, u otro proveedor de cuidados sanitarios, o los que trabajan bajo sus instrucciones, mientras que la recepción, directa o indirectamente, puede realizarse por cualquier persona que realice el método o los métodos. La petición puede ser por cualquier medio de comunicación, incluyendo comunicación que es escrita, oral, electrónica, digital, analógica, telefónica, en persona, por facsímil, por correo, o que pase de otro modo a través de una jurisdicción dentro de los Estados Unidos.
La invención proporciona además métodos en el procesamiento de reembolso o pago para un ensayo, tal como el método anterior en el cuidado médico de un paciente u otro método de la invención. Un método en el procesamiento del reembolso o pago puede comprender indicar que 1) el pago se ha recibido, o 2) el pago se realizará por otro pagador, o 3) el pago sigue sin realizarse en papel o en una base de datos después de la realización de una detección de nivel de expresión, determinación o método de medición de la invención. La base de datos puede estar en cualquier forma, estando las formas electrónicas tales como una base de datos implementada por ordenador incluidas dentro del alcance de la invención. La indicación puede estar en forma de un código en papel o en la base de datos. El “otro pagador” puede ser cualquier persona o entidad más allá de a la que se haya realizado una petición previa de reembolso o pago.
Como alternativa, el método puede comprender recibir reembolso o pago por la realización técnica o real del método anterior en el cuidado médico de un paciente; por la interpretación de los resultados de dicho método; o por cualquier otro método de la invención. Por supuesto la invención también incluye realizaciones que comprenden dar instrucciones a otra persona o parte para que reciba el reembolso o pago. La petición puede realizarse por cualquier medio de comunicación, incluyendo los descritos anteriormente. El recibo puede ser de cualquier entidad, incluyendo una compañía aseguradora, organización de mantenimiento de salud, agencia sanitaria gubernamental o un paciente como ejemplos no limitantes. El pago puede ser completo o en parte. En el caso de un paciente, el pago puede ser en forma de un pago parcial conocido como copago.
En otra realización más, el método puede comprender enviar o haber enviado una petición de reembolso o pago a una compañía aseguradora, organización de mantenimiento de la salud, agencia sanitaria gubernamental o a un
5
10
15
20
25
30
35
40
45
50
55
paciente por la realización del método anterior en el cuidado médico de un paciente u otro método de la invención. La petición puede ser por cualquier medio de comunicación, incluyendo los descritos anteriormente.
En una realización adicional, el método puede comprender recibir indicación de la aprobación para el pago, o rechazo del pago, por la realización del método anterior en el cuidado médico de un paciente u otro método de la invención. Dicha indicación puede venir de cualquier persona o parte a la que se realice una petición de reembolso o pago. Los ejemplos no limitantes incluyen una compañía aseguradora, organización de mantenimiento de la salud o una agencia sanitaria gubernamental, como Medicare o Medicaid como ejemplos no limitantes. La indicación puede ser por cualquier medio de comunicación, incluyendo los descritos anteriormente.
Una realización adicional es en la que el método comprende enviar una petición de reembolso para la realización del método anterior en el cuidado médico de un paciente u otro método de la invención. Dicha petición puede realizarse por cualquier medio de comunicación, incluyendo los descritos anteriormente. La petición puede haberse realizado en una compañía aseguradora, organización de mantenimiento de la salud, agencia sanitaria federal o al paciente para el que se realizó el método.
Un método adicional comprende indicar la necesidad de reembolso o pago en una forma o en una base de datos para realización del método anterior en el cuidado médico de un paciente u otro método de la invención. Como alternativa, el método puede indicar simplemente la realización del método. La base de datos puede estar en cualquier forma, estando formas electrónicas tales como una base de datos implementada por ordenador incluidas en el alcance de la invención. La indicación puede ser en forma de un código en papel o en la base de datos.
En los métodos anteriores en el cuidado médico de un paciente u otro método de la invención, el método puede comprender indicar los resultados del método, opcionalmente a una instalación de cuidado médico, un proveedor o profesional de cuidados sanitarios, un doctor, un enfermero, o personal que trabaja para los mismos. La indicación puede ser también directamente o indirectamente al paciente. La indicación puede ser por cualquier medio de comunicación, incluyendo los descritos anteriormente.
La invención proporciona además kits para la determinación o medición de los niveles de expresión génica en una muestra que contiene células como se describe en el presente documento. Un kit comprenderá típicamente uno o más reactivos para detectar la expresión génica como se describe en el presente documento para la práctica de la presente invención. Los ejemplos no limitantes incluyen sondas o cebadores polinucleotídicos para la detección de niveles de expresión, una o más enzimas usadas en los métodos de la invención, y uno o más tubos para su uso en la práctica de la invención. En algunas realizaciones, el kit incluirá una matriz, o medio sólido capaz de ensamblarse en una matriz, para la detección de expresión génica como se describe en el presente documento. En otras realizaciones, el kit puede comprender uno o más anticuerpos que son inmunorreactivos con epítopos presentes en un polipéptido que indica la expresión de una secuencia génica. En algunas realizaciones el anticuerpo será un fragmento de anticuerpo.
Un kit de la invención también puede incluir materiales de instrucciones que desvelan o describen el uso del kit o un cebador o sonda de la presente invención en un método de la invención como se proporciona en el presente documento. Un kit también puede incluir componentes adicionales para facilitar la aplicación particular para la que se diseña el kit. Por lo tanto, por ejemplo, un kit puede contener adicionalmente medios para detectar el marcador (por ejemplo sustratos enzimáticos para marcadores enzimáticos, conjuntos de filtros para detectar marcadores fluorescentes, marcadores secundarios apropiados tales como anti HRP de ratón de oveja o similares). Un kit puede incluir adicionalmente tampones y otros reactivos reconocidos para su uso en un método de la invención.
Habiendo descrito ahora en general la invención, la misma se entenderá más fácilmente mediante referencia a los siguientes ejemplos que se proporcionan como ilustración, y no se pretende que sean limitantes de la presente invención, a no ser que se especifique.
Ejemplos
Ejemplo 1: Materiales y métodos
La siguiente tabla muestra los tipos y número de muestras de tumores conocidos usados en el Ejemplo 2.
Tipo tumoral
Adrenal
Cerebral-glial
Cerebral-Meningioma
Mama
Cuello uterino-adeno Cuello uterino-escamoso
Número de muestras
7
16
7 43
8
13
- Endometrio
- 13
- Vesícula biliar
- 5
- Células germinales
- 22
- GIST
- 10
- Riñón
- 11
- Leiomiosarcoma
- 13
- Hígado
- 14
- Pulmón-adeno
- 9
- Pulmón-grandes
- 9
- Pulmón-pequeñas
- 8
- Pulmón-escamoso
- 10
- Linfoma-B
- 7
- Linfoma-Hodgkins
- 9
- Linfoma-T
- 5
- Mesotelioma
- 10
- Osteosarcoma
- 7
- Ovario-claro
- 14
- Ovario-seroso
- 14
- Páncreas
- 24
- Próstata
- 11
- Piel-células basales
- 5
- Piel-melanoma
- 10
- Piel-escamoso
- 6
- Intestino delgado y grueso
- 42
- Tejido blando-Liposarcoma
- 5
- Tejido blando-MFH
- 11
- Tejido blando-Sarcoma-sinovial
- 7
- Estómago-adeno
- 9
- T estículo-Seminoma
- 10
- Tiroides-folicular-papilar
- 12
- Tiroides-medular
- 7
- Vejiga Urinaria
- 25
- Total
- 468
- Conducto Biliar
- 1
- Colangiocarcinoma
- 4
- Esófago
- 2
- Esófago-Barretts
- 4
- Esófago-escamoso
- 4
- HN-escamoso
- 3
- Ovario (no clasificado)
- 1
- Ovario-endometrioide
- 1
- Ovario-mucinoso
- 4
- Ovario-del estroma
- 1
- Tejido blando-sarcoma de Ewing
- 2
- Tejido blando-Fibrosarcoma
- 2
- Tejido blando-Rabdomiosarcoma
- 3
- Total
- 32
Las 500 muestras fueron muestras nuevas o congeladas de tejido que contenía tumor. Las 468 muestras mostradas anteriormente se usaron para experimentos adicionales tomando 374 como el conjunto de entrenamiento y las 94 muestras restantes como el conjunto de ensayo. Los tipos tumorales de menos de 5 muestras no se usaron 5 inicialmente.
5
10
15
20
25
30
35
40
45
50
55
60
65
Las muestras contenían tumores tanto primarios como metastásicos con un diagnóstico confirmado. Se tiñó una única sección de 5 pm (H+E) y el tumor se visualizó. Se obtuvieron poblaciones tumorales puras mediante disección manual, o microdisección de captura por láser (Arcturus, Mountain View, CA).
Se realizaron extracción de ARN y control de calidad en cada muestra. Brevemente, se procesaron muestras usando un método de extracción basado en columna de centrifugación de sílice (Arcturus, Mountain View, CA). La cantidad total de ARN extraído se evaluó usando PCR cuantitativa (Taqman, ABI), con cebadores específicos para transcripción de p-actina. Solamente se amplificaron muestras con más de 10 ng de ARN.
Las muestras se amplificaron usando un protocolo de amplificación de 2 ciclos de ARN polimerasa modificado (Arcturus, Mountain View, CA). Después de la amplificación, la producción del producto de ARN se cuantificó mediante espectroscopia de DO(260/280), y el producto amplificado se visualizó por electroforesis en gel desnaturalizante de agarosa (2 %).
El producto amplificado de cada muestra se hibridó después con una microarray para detectar el nivel de expresión de transcrito en las muestras. Se realizó selección génica aleatoria usando software de función de muestreo aleatorio. Para cada número de genes seleccionado, las muestras aleatorias se seleccionaron 100 veces y se usaron para calcular la validación cruzada y precisiones predictivas en conjuntos tanto de entrenamiento como de ensayo. La validación cruzada fue dividiendo el conjunto de entrenamiento en partes usándose una para entrenamiento y usándose la otra como un ensayo.
Ejemplo 2: Resultados
La media de las precisiones de 100 muestreos y el intervalo de confianza al 95 % se calcularon y se representaron para cada etapa de 50 a 16948 genes. Las representaciones mostraron la validación cruzada y precisiones predictivas a partir del algoritmo KNN (vecino más cercano a k) frente al número de genes seleccionado aleatoriamente. La selección génica aleatoria usó función de muestreo aleatorio en el software R.
50 o más genes pudieron clasificarse con precisión entre los numerosos tipos tumorales en total con una precisión mayor del 50 %. Se observaron resultados similares con el uso de las muestras y KNN con muestras de ensayo tumorales de FFPE de las que se extrajo ARN y se analizaron para expresión génica.
Debería observarse que aunque la precisión se estabilizó con el uso de genes adicionales, se espera que haya conjuntos particulares de 50 o más genes que tengan precisiones significativamente mayores. Puede realizarse clasificación de tipos tumorales adicionales tales como los que suman 32 muestras en la tabla anterior, con la inclusión de muestras adicionales.
Se determinó que el nivel de precisión de un conjunto de 100 secuencias génicas expresadas seleccionadas aleatoriamente era del 66 % y se usó como se describe en el Ejemplo 3 para generar las Figuras 1 y 2.
Ejemplo 3: Capacidad de información de conjuntos génicos aleatorios
Se ensayaron subconjuntos de las 100 secuencias génicas expresadas seleccionadas aleatoriamente usadas para clasificar entre 39 tipos tumorales con respecto a su capacidad para clasificarse entre subconjuntos de los 39 tipos tumorales. Los niveles de expresión de combinaciones aleatorias de 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 y las 100 (cada combinación muestreada 10 veces) de las 100 secuencias expresadas se usaron con datos de tipos tumorales y después se usaron para predecir conjuntos aleatorios de ensayo de muestras tumorales (cada una muestreada 10 veces) que varió de 2 a los 39 tipos. La Figura 1 muestra la capacidad de clasificación de diversos conjuntos génicos que se muestran en relación con el número de tipos tumorales clasificados. Como se esperaba, es necesario un mayor número de secuencias génicas para clasificar los tipos tumorales con mayores precisiones. La Figura 2 muestra el rendimiento de clasificación para diversos números de tipos tumorales en relación con el número de secuencias génicas usadas.
Los números de referencia de GenBank de las 100 secuencias génicas son AF269223, BC006286, AK025501, AJ002367, AI469140, AW013883, NM_001238, AI476350, BC006546, AI041212, BF724944, AI376951, R56211, BC006393, X13274, BC001133, N62397, BC000885, AK001588, AK057901, AF146760, AI951287, AK025604, BC007581, BC015025, R43102, AW449550, AI922539, AI684144, AI277662, BC015999, AW444656, BC011612, BC015401, BF447279, BC009956, AL050163, BC001248, BE672684, AL137353, BC001340, U45975, BE856598, BC009060, AL137728, AA713797, AL583913, AK054617, AI028262, AI753041, BG939593, AL080179, AA814915, AF131798, AI961568, BC009849, AK021603, BC012561, AI570494, BC006973, AW294857, BC004952, AK026535, AI923614, AW082090, AI005513, AF339768, AK023167, AF169693, AF076249, BC007662, BC015520, AI814187, AI565381, AW271626, AK024120, AF139065, BC014075, AI887245, AF257081, AI767898, AF070634, AF155132, X69804, U65579, NM_004933, AI655104, AW131780, AI650407, AF131774, AA814057, AJ311123, BC009702, AF264036, AL161961, AJ010857, AF106912, AK023542, AF073518 y D83032. Se catalogaron de 1 a 100 y los conjuntos representativos, y no limitantes, aleatorios usados en la invención son los siguientes.
5
10
15
20
25
30
35
40
45
50
55
60
65
Para 50 genes, conjunto 1, se usaron los genes 9, 52, 55, 24, 44, 58, 20, 79, 81, 86, 22, 84, 27, 32, 73, 70, 18, 41,
54, 38, 46, 78, 87, 49, 15, 95, 12, 23, 30, 13, 36, 98, 28, 56, 21, 19, 35, 51, 25, 43, 99, 34, 64, 66, 82, 72, 11, 92, 59 y
71. En el conjunto 2, se usaron los genes 72, 92, 27, 8, 14, 87, 42, 83, 65, 85, 40, 21, 74, 66, 6, 28, 13, 98, 91, 78,
49, 52, 33, 30, 97, 84, 2, 95, 88, 64, 93, 11, 1, 45, 61, 39, 12, 67, 53, 89, 43, 17, 54, 7, 55, 38, 3, 15, 70 y 31. En el
conjunto 3, se usaron los genes 9, 35, 87, 52, 73, 74, 88, 22, 41, 28, 93, 15, 67, 20, 68, 17, 46, 43, 51,24, 84, 79, 19, 100, 76, 6, 49, 97, 16, 59, 89, 66, 45, 63, 2, 27, 13, 98, 69, 60, 26, 86, 83, 58, 71, 54, 82, 32, 42 y 77. En el conjunto
4, se usaron los genes 34, 67, 48, 53, 24, 61, 6, 64, 89, 76, 35 ,21, 86, 83, 68, 7, 25, 65, 58, 28, 97, 90, 31, 57, 3, 50,
2, 96, 84, 29, 42, 46, 82, 62, 19, 95, 44, 52, 33, 36, 15, 37, 70, 11, 43, 13, 8, 49, 16 y 99. En el conjunto 5, se usaron los genes 11, 22, 87, 25, 5, 38, 35, 68, 94, 51, 60, 53, 20, 42, 95, 92, 33, 15, 14, 24, 85, 37, 69, 17, 19, 93, 8, 97, 46, 83, 26, 86, 66, 89, 63, 16, 74, 28, 52, 2, 96, 99, 71, 10, 65, 90, 29, 34, 77 y 45. En el conjunto 6, se usaron los genes 62, 6, 69, 12, 19, 50, 51, 5, 1, 32, 41, 84, 27, 10, 93, 28, 79, 21, 88, 47, 58, 64, 74, 39, 33, 46, 17, 86, 87, 4, 60, 98,
97, 45, 26, 72, 40, 63, 30, 54, 52, 11, 15, 96, 14, 24, 73, 67, 59 y 38. En el conjunto 7, se usaron los genes 67, 21,
62, 15, 59, 6, 23, 30, 89, 94, 82, 74, 96, 17, 41, 38, 48, 100, 5, 71, 20, 55, 79, 28, 44, 64, 92, 65, S 1, 37, 32, 22, 72,
98, 12, 54, 78, 50, 60, 76, 88, 3, 40, 80, 77, 16, 24, 42, 8 y 14. En el conjunto 8, se usaron los genes 43, 68, 8, 38,
82, 73, 12, 23, 77, 63, 56, 33, 66, 14, 47, 17, 53, 62, 42, 57, 30, 89, 44, 58, 34, 24, 81, 40, 45, 1, 99, 52, 37, 80, 96,
10, 71, 50, 20, 51, 18, 54, 31, 70, 84, 3, 83, 76, 59 y 91. En el conjunto 9, se usaron los genes 36, 90, 34, 79, 29, 24,
44, 51, 27, 58, 52, 37, 68, 49, 89, 80, 57, 8, 22, 77, 54, 65, 26, 91, 21, 64, 59, 61, 13, 74, 87, 50, 63, 20, 78, 23, 96,
67, 30, 55, 81, 35, 72, 56, 95, 82, 39, 42, 88 y 92. En el conjunto 10, se usaron los genes 59, 94, 91, 88, 3, 45, 13,
96, 66, 58, 60, 69,21, 95, 4, 7, 67, 83, 44, 2, 37, 24, 8, 12, 53, 47, 34, 9, 31, 46, 11, 68, 1, 6, 29, 14, 33, 54, 43, 80, 39, 18, 100, 10, 84, 65, 5, 76, 26 y 22.
Para 55 genes, conjunto 1, se usaron los genes 20, 76, 33, 73, 15, 83, 47, 2, 95, 67, 26, 49, 97, 25, 46, 13, 51, 42, 14, 11, 39, 94, 37, 100, 56, 63, 6, 66, 45, 75, 3, 78, 55, 7, 72, 44, 35, 48, 65, 38, 60, 90, 30, 36, 77, 23, 16, 32, 80, 89, 8, 91, 43, 50 y 28. En el conjunto 2, se usaron los genes 11, 63, 93, 79, 21, 57, 66, 10, 42, 83, 75, 94, 3, 38, 49,
91, 53, 90, 50, 52, 39, 99, 85, 48, 31, 18, 89, 25, 87, 56, 40, 5, 19, 88, 27, 92, 20, 100, 59, 43, 95, 80, 86, 44, 55, 68,
54, 33, 96, 45, 2, 9, 81, 73 y 37. En el conjunto 3, se usaron los genes 20, 73, 76, 29, 44, 33, 84, 98, 15, 69, 32, 14,
50, 70, 63, 41, 87, 74, 99, 34, 23, 36, 37, 68, 89, 43, 91, 18, 26, 45, 9, 90, 28, 92, 7, 30, 22, 54, 96, 72, 16, 38, 58,
52, 56, 79, 57, 47, 83, 17, 49, 2, 80, 51 y 46. En el conjunto 4, se usaron los genes 90, 63, 60, 82, 81, 50, 25, 24, 56,
9, 8, 89, 70, 55, 15, 4, 35, 75, 77, 46, 87, 6, 49, 85, 98, 58, 28, 27, 64, 47, 99, 51, 86, 21, 54, 80, 41, 74, 88, 14, 36,
2, 23, 32, 19, 30, 52, 84, 62, 37, 43, 53, 72, 39 y 92. En el conjunto 5, se usaron los genes 27, 43, 33, 84, 89, 31, 60,
97, 15, 45, 42, 73, 4, 6, 90, 61, 72, 56, 2, 38, 96, 74, 94, 14, 25, 77, 58, 86, 21, 32, 82, 3, 50, 17, 28, 48, 44, 7, 70,
20, 59, 83, 1, 71, 52, 95, 69, 54, 39, 46, 63, 51, 57, 34 y 22. En el conjunto 6, se usaron los genes 96, 12, 94, 27, 11,
33, 25, 22, 26, 50, 60, 70, 68, 30, 82, 34, 17, 32, 29, 19, 87, 76, 81, 7, 55, 35, 45, 56, 31, 99, 5, 24, 54, 97, 21, 92,
98, 36, 88, 23, 58, 77, 14, 95, 9, 73, 84, 61, 2, 38, 83, 65, 42, 74 y 48. En el conjunto 7, se usaron los genes 52, 11,
79, 27, 23, 64, 96, 33, 75, 12, 34, 94, 26, 78, 67, 51, 57, 70, 28, 89, 9, 98, 62, 91, 41, 65, 73, 74, 8, 16, 90, 37, 1, 10,
59, 81, 63, 30, 80, 18, 15, 48, 36, 19, 84, 14, 45, 38, 97, 99, 3, 82, 54, 22 y 5. En el conjunto 8, se usaron los genes
83, 57, 6, 37, 44, 76, 5, 59, 74, 62, 72, 23, 93, 75, 32, 100, 98, 29, 30, 65, 21, 17, 78, 46, 13, 82, 14, 50, 66, 63, 90,
49, 54, 68, 60, 10, 87, 94, 58, 91, 33, 31, 36, 8, 11, 92, 51, 38, 43, 52, 7, 86, 89, 84 y 70. En el conjunto 9, se usaron los genes 29, 100, 79, 21, 63, 12, 51, 2, 18, 77, 81, 33, 68, 69, 13, 23, 37, 39, 14, 3, 93, 36, 5, 35, 30, 40, 28, 61, 49,
71, 27, 99, 75, 96, 83, 97, 78, 54, 19, 89, 62, 38, 8, 53, 26, 43, 52, 25, 58, 9, 31, 86, 65, 6 y 60. En el conjunto 10, se
usaron los genes 7, 37, 22, 39, 41, 89, 57, 75, 6,23, 47, 51, 55, 93, 49, 5, 15, 79, 20, 11, 42, 87, 78, 33, 68, 76, 94, 77, 62, 16, 31, 54, 28, 99, 90, 61, 25, 21, 59, 73, 83, 95, 30, 91, 65, 24, 4, 17, 10, 72, 63, 98, 34, 69 y 1.
Para 60 genes, conjunto 1, se usaron los genes 67, 60, 53, 20, 3, 9, 87 ,16, 1, 14, 96, 82, 79, 94, 35, 32, 44, 22, 17, 46, 59, 29, 40, 57, 68, 52 ,48, 31, 34, 23, 91, 38, 92, 49, 51, 86, 88, 55, 50, 39, 83, 65, 11, 42, 4, 63, 47, 73, 84, 75,
77, 18, 74, 100, 26, 5, 72, 10, 90 y 76. En el conjunto 2, se usaron los genes 62, 67, 70, 82, 8, 10, 26, 45, 98, 38, 76,
14, 72, 36, 89, 95, 86, 96, 18, 91, 75, 74, 7, 46, 16, 83, 65, 33, 29, 57, 32, 42, 34, 37, 80, 100, 99, 9, 2, 22, 64, 11,
87, 35, 23, 55, 60, 61, 81, 49, 5, 58, 3, 40, 71, 54, 85, 94, 66 y 20. En el conjunto 3, se usaron los genes 49, 10, 76,
94, 83, 90, 42, 57, 38, 85, 29, 1, 60, 71, 65, 30, 64, 23, 72, 27, 70, 13, 100, 43, 20, 44, 4, 88, 79, 24, 84, 91, 87, 41,
21, 48, 54, 68, 16, 35, 6, 89, 2, 34, 96, 22, 99, 52, 28, 3, 15, 47, 7, 61, 63, 75, 19, 97, 56 y 39. En el conjunto 4, se
usaron los genes 99, 94, 58, 51, 46, 87, 77, 23, 9, 74, 52, 4, 47, 42, 5, 62, 48, 14, 35, 32, 75, 98, 95, 18, 67, 76, 50,
8, 1, 19, 22 ,72, 11, 83, 82, 89, 12, 24, 90, 80, 92, 85, 26, 66, 38, 78, 79, 60, 49, 59, 25, 84, 36, 29, 45, 55, 27, 70, 39 y 57. En el conjunto 5, se usaron los genes 39, 21, 70, 81, 88, 30, 2, 57, 45, 5, 47, 93, 1, 34, 51, 49, 3, 6, 65, 97, 41, 67, 95, 85, 98, 29, 82, 38, 17, 84, 72, 52, 20, 33, 53, 66, 7, 54, 25, 23, 80, 61, 76, 9, 14, 48, 26, 12, 32, 4, 64, 73, 56,
87, 59, 35, 31, 62, 13 y 15. En el conjunto 6, se usaron los genes 99, 80, 35, 87, 17, 27, 53, 43, 38, 45, 61, 34, 81, 3,
16, 42, 24, 37, 19, 39, 59, 6, 28, 74, 32, 92, 18, 31, 25, 66, 79, 41, 51, 97, 58, 7, 49, 70, 71, 33, 78, 85, 63, 72, 89,
15, 40, 29, 46, 1, 73, 68, 56, 54, 47, 5, 65, 100, 44 y 22. En el conjunto 7, se usaron los genes 15, 51, 66, 47, 4, 82,
78, 71, 72, 75, 61, 10, 34, 18, 12, 55, 32, 80, 45, 14, 3, 62, 20, 74, 96, 48, 94, 88, 69, 64, 86, 9, 24, 41, 8, 28, 81, 13,
37, 87, 53, 44, 57, 43, 30, 38, 67, 5, 100, 91, 50, 2, 42, 77, 7, 83, 73, 99, 68 y 6. En el conjunto 8, se usaron los genes 41, 21, 20, 62, 50, 86, 13, 23, 94, 45, 80, 51, 42, 52, 47, 76, 18, 72, 25, 8, 35, 58, 37, 32, 46, 71, 99, 33, 48, 77, 38, 19, 44, 66, 7, 53, 12, 10, 74, 96, 84, 28, 30, 15, 2, 81, 7, 26, 79, 88, 24, 49, 65, 17, 95, 63, 75, 11, 55 y 36. En el conjunto 9, se usaron los genes 14, 40, 30, 48, 37, 3, 28, 57, 58, 22, 70, 74, 91, 98, 46, 76, 81, 65, 54, 23, 11, 34,
17, 53, 26, 67, 80, 42, 86, 73, 25, 24, 9, 88, 38, 45, 13, 56, 83, 87, 31, 36, 43, 100, 35, 41, 16, 33, 61, 6, 49, 63, 71,
64, 96, 8, 19, 39, 68 y 84. En el conjunto 10, se usaron los genes 97, 39, 83, 8, 35, 74, 13, 96, 20, 19, 69, 10, 81, 57,
65, 17, 12, 48, 86, 4, 94, 25, 92, 22, 55, 43, 34, 45, 73, 18, 31, 15, 2, 61, 51, 91, 89, 82, 68, 46, 24, 77, 27, 88, 72,
16, 37, 70, 29, 60, 80, 14, 23, 44, 49, 66, 62, 32, 28 y 98.
5
10
15
20
25
30
35
40
45
50
55
60
65
Para 65 genes, conjunto 1, se usaron los genes 68, 57, 82, 75, 62, 43, 41, 76, 59, 34, 78, 95, 32, 79, 88, 46, 4, 89,
96, 84, 66, 10, 31, 23, 52, 16, 85, 98, 28, 25, 74, 69, 39, 63, 64, 58, 65, 30, 13, 19, 40, 50, 48, 6, 93, 2, 11, 51, 100, 26, 27, 24, 1, 87, 91, 38, 5, 21, 56, 35, 61, 17, 90, 94 y 83. En el conjunto 2, se usaron los genes 62, 33, 59, 65, 12,
97, 20, 99, 13, 64, 29, 23, 49, 35, 66, 74, 77, 46, 14, 11, 81, 32, 42, 34, 70, 17, 54, 44, 24, 53, 3, 8, 71, 47, 96, 80,
86, 40, 15, 37, 90, 67, 73, 50, 25, 51, 36, 75, 72, 92, 93, 4, 84, 18, 76, 21, 38, 88, 68, 9, 60, 52, 45, 7 y 41. En el
conjunto 3, se usaron los genes 12, 80, 56, 70, 50, 95, 15, 85, 93, 53, 45, 47, 10, 99, 32, 76, 67, 89, 83, 35, 91, 62, 6,
84, 23, 52, 65, 9, 37, 4, 51, 42, 48, 49, 100, 21, 5, 43, 75, 92, 98, 36, 16, 27, 19, 22, 82, 73, 58, 63, 34, 74, 3, 71, 87,
72, 81, 1, 68, 46, 55, 88, 64, 11 y 33. En el conjunto 4, se usaron los genes 16, 41, 15, 40, 19, 47, 77, 96, 5, 21, 38, 84, 22, 27, 81, 46, 74, 36, 8, 52, 98, 87, 91, 54, 86, 80, 25, 39, 75, 42, 10, 83, 51, 90, 62, 78, 17, 9, 53, 68, 12, 100,
24, 89, 20, 58, 59, 11, 92, 32, 30, 95, 49, 55, 73, 82, 99, 70, 97, 13, 6, 93, 67, 29 y 45. En el conjunto 5, se usaron los genes 94, 3, 31, 85, 51, 80, 8, 55, 22, 93, 97, 49, 14, 81, 67, 76, 77, 75, 19, 59, 5, 72, 34, 62, 58, 43, 7, 44, 35,
98, 24, 74, 41, 73, 63, 13, 87, 56, 15, 42, 12, 91, 50, 37, 29, 40, 53, 83, 2, 99, 100, 1, 10, 33, 16, 26, 9, 71, 39, 11,
46, 57, 66, 92 y 82. En el conjunto 6, se usaron los genes 86, 55, 15, 9, 13, 94, 33, 16, 14, 11, 32, 59, 88, 64, 90, 50,
45, 82, 7, 44, 48, 98, 21, 51, 62, 99, 75, 25, 19, 41, 24, 26, 17, 23, 6, 71, 72, 47, 42, 2, 85, 22, 56, 81, 78, 79, 43, 18,
100, 36, 34, 70, 39, 80, 66, 97, 58, 31, 30, 57, 35, 96, 12, 29 y 10. En el conjunto 7, se usaron los genes 16, 50, 4, 18, 60, 65, 37, 94, 1, 88, 76, 71, 31, 2, 53, 59, 19, 26, 28, 89, 87, 77, 63, 57, 92, 55, 20, 93, 72, 38, 46, 62, 45, 11,
52, 95, 54, 14, 36, 42, 39, 64, 7, 99, 86, 78, 27, 43, 66, 58, 25, 81, 79, 41, 90, 13, 73, 67, 32, 44, 23, 34, 29, 6 y 35.
En el conjunto 8, se usaron los genes 8, 53, 3, 33, 84, 61, 74, 98, 31, 9, 55, 62, 4, 88, 27, 50, 85, 34, 69, 83, 99, 17,
25, 19, 40, 90, 45, 30, 28, 92, 93, 75, 95, 37, 6, 24, 79, 96, 70, 60, 91, 52, 89, 49, 10, 100, 39, 77, 41, 23, 29, 20, 22,
5, 16, 59, 21, 46, 80, 32, 73, 72, 2, 26 y 48. En el conjunto 9, se usaron los genes 98, 82, 24, 35, 25, 93, 5, 56, 76,
96, 2, 78, 40, 13, 83, 86, 92, 77, 81, 29, 5 8, 99, 97, 80, 18, 27, 1, 65, 14, 16, 59, 20, 26, 67, 32, 22, 90, 37, 85, 7, 41,
34, 4, 68, 45, 12, 79, 62, 17, 75, 84, 91, 54, 72, 57, 10, 95, 44, 52, 9, 28, 89, 100, 33 y 21. En el conjunto 10, se usaron los genes 96, 40, 22, 50, 75, 38, 98, 89, 55, 60, 86, 18, 87, 85, 49, 2, 57, 73, 33, 29, 59, 42, 63, 68, 62, 92, 74, 53, 8, 7, 51, 71, 11, 30, 83, 56, 77, 81, 79, 16, 37, 69, 61, 64, 27, 67, 25, 100, 31, 3, 13, 4, 12, 21, 65, 99, 36, 66,
6, 94, 44, 35, 72, 95 y 90.
Para 70 genes, conjunto 1, se usaron los genes 36, 6, 100, 39, 37, 3, 27, 45, 93, 19, 89, 43, 68, 9, 60, 46, 51, 80, 32,
52, 62, 35, 58, 14, 10, 33, 85, 12, 64, 67, 75, 86, 17, 44, 83, 24, 87, 84, 23, 96, 79, 20, 13, 8, 11, 76, 88, 56, 38, 98,
29, 16, 99, 2, 66, 30, 48, 26, 5, 25, 78, 42, 47, 94, 15, 4, 55, 65, 97 y 71. En el conjunto 2, se usaron los genes 96,
98, 38, 32, 52, 25, 31, 14, 91, 53, 8, 94, 49, 27, 69, 20, 44, 4, 92, 56, 61, 97, 18, 65, 66, 54, 21, 3, 29, 79, 80, 70, 77,
50, 39, 99, 58, 23, 85, 51, 15, 72, 33, 19, 24, 68, 7, 41, 81, 64, 57, 73, 84, 46, 22, 74, 11, 45, 55, 82, 6, 47, 59, 42,
88, 9, 16, 34, 83 y 30. En el conjunto 3, se usaron los genes 27, 46, 30, 54, 47, 94, 26, 38, 73, 31, 43, 8, 50, 48, 6,
56, 59, 25, 89, 52, 78, 68, 49, 29, 83, 92, 97, 98, 4, 3, 95, 87, 23, 1, 51, 44, 34, 35, 85, 61, 22, 84, 42, 13, 75, 93, 45,
88, 19, 80, 39, 24, 77, 2, 55, 62, 11, 90, 18, 81, 57, 20, 96, 28, 7, 70, 86, 5, 63 y 69. En el conjunto 4, se usaron los
genes 65, 29, 88, 19, 42, 30, 15, 16, 74, 53, 25, 8, 95, 5, 69, 99, 59, 67, 84, 14, 80, 12, 37, 13, 71, 39, 43, 100, 60,
79, 51, 11, 45, 82, 83, 61, 62, 90, 6, 20, 2, 18, 97, 1, 48, 81, 35, 87, 56, 36, 93, 41, 54, 46, 10, 27, 47, 33, 55, 64, 26,
57, 85, 89, 9, 96, 72, 68, 23 y 32. En el conjunto 5, se usaron los genes 25, 41, 56, 91, 19, 22, 63, 39, 59, 83, 7, 74,
20, 86, 84, 2, 43, 73, 69, 58, 35, 26, 23, 42, 29, 10, 13, 77, 16, 72, 71, 81, 40, 66, 80, 50, 12, 48, 64, 100, 24, 94, 97,
57, 98, 68, 78, 92, 53, 31, 45, 38, 61, 75, 5, 1, 44, 99, 3, 36, 88, 34, 21, 17, 15, 89, 37, 51, 85 y 79. En el conjunto 6, se usaron los genes 59, 78, 34, 83, 5, 11, 60, 97, 3, 9, 20, 90, 33, 8, 31, 10, 80, 7, 92, 15, 23, 72, 14, 86, 82, 18, 42, 88, 94, 48, 79, 73, 77, 52, 95, 16, 87, 28, 98, 71, 74, 21, 67, 6, 66, 35, 99, 29, 32, 75, 26, 39, 47, 45, 50, 41, 54, 1, 84, 85, 91, 100, 61, 12, 37, 4, 25, 55, 46 y 13. En el conjunto 7, se usaron los genes 63, 14, 66, 75, 12, 2, 90, 81, 27, 72, 70, 89, 59, 46, 6, 53, 22, 80, 30, 79, 82, 71, 92, 19, 73, 83, 38, 40, 1, 68, 20, 8, 50, 74, 94, 26, 35, 28, 43, 34, 77,
18, 96, 16, 95, 85, 15, 9, 11, 84, 39, 10, 54, 65, 57, 25, 60, 51, 55, 33, 17, 44, 29, 58, 93, 62, 21, 4, 7 y 78. En el
conjunto 8, se usaron los genes 60, 76, 17, 29, 68, 24, 54, 87, 16, 66, 15, 8, 85, 92, 67, 100, 82, 74, 41, 33, 3, 35, 94, 78, 58, 75, 98, 63, 95, 12, 47, 81, 91, 9, 7, 83, 77, 22, 89, 56, 49, 31, 96, 2, 70, 23, 46, 6, 39, 90, 59, 71, 44, 10, 36,
52, 42, 86, 5, 64, 55, 69, 84, 28, 93, 53, 38, 27, 13 y 26. En el conjunto 9, se usaron los genes 21, 24, 41, 29, 92, 30,
51, 31, 83, 71, 37, 23, 11, 53, 14, 93, 45, 69, 52, 56, 70, 68, 3, 79, 26, 58, 66, 15, 50, 95, 16, 2, 4, 5, 28, 42, 34, 9, 82, 6, 63, 44, 87, 32, 59, 80, 55, 96, 54, 89, 22, 94, 36, 46, 40, 86, 98, 38, 67, 85, 35, 60, 25, 1, 78, 61, 17, 64, 7 y 91. En el conjunto 10, se usaron los genes 93, 44, 77, 3, 31, 64, 39, 89, 23, 51, 78, 85, 35, 81, 22, 74, 97, 14, 27, 13, 16, 88, 28, 61, 57, 79, 99, 37, 30, 36, 24, 11, 45, 34, 54, 50, 41, 1, 7, 48, 56, 63, 58, 49, 17, 26, 15, 69, 2, 53, 43, 62, 55, 100, 95, 52, 83, 29, 19, 38, 59, 76, 20, 87, 66, 25, 72, 70, 4 y 73.
Para 75 genes, conjunto 1, se usaron los genes 73, 40, 56, 32, 59, 42, 70, 12, 100, 6, 28, 11, 43, 55, 5, 64, 80, 99, 23, 57, 18, 82, 60, 61, 31, 81, 14, 3, 91, 76, 86, 19, 26, 83, 38, 29, 8, 36, 69, 85, 96, 27, 47, 10, 35, 39, 94, 24, 62,
34, 54, 65, 25, 90, 51, 67, 41, 46, 33, 1, 37, 49, 9, 71, 13, 21, 44, 2, 98, 52, 84, 20, 74, 93 y 88. En el conjunto 2, se
usaron los genes 26, 21, 43, 56, 15, 55, 9, 34, 58, 12, 85, 44, 20, 99, 74, 35, 39, 88, 53, 8, 92, 67, 6, 48, 69, 28, 23,
87, 71, 5, 72, 89, 38, 100, 25, 1, 13, 3, 14, 29, 96, 62, 64, 90, 78, 63, 68, 66, 11, 41, 77, 42, 4, 60, 24, 98, 18, 17, 52,
46, 30, 32, 70, 33, 31, 83, 45, 36, 84, 95, 82, 80, 22, 50 y 73. En el conjunto 3, se usaron los genes 96, 11, 58, 14,
77, 32, 6, 28, 55, 12, 40, 72, 83, 7, 89, 67, 51, 63, 95, 15, 74, 99, 88, 81, 84, 38, 36, 13, 87, 5, 69, 62, 19, 86, 90, 76,
66, 33, 52, 4, 20, 78, 59, 27, 17, 2, 43, 75, 64, 79, 53, 26, 3, 42, 100, 48, 71, 85, 41, 25, 61, 57, 49, 70, 37, 80, 24,
94, 30, 54, 9, 35, 21, 16 y 22. En el conjunto 4, se usaron los genes 48, 31, 73, 90, 10, 100, 32, 56, 83, 38, 93, 7, 53,
8, 79, 15, 63, 5, 92, 76, 58, 59, 35, 67, 2, 98, 23, 37, 24, 94, 25, 9, 46, 36, 82, 40, 89, 27, 34, 71, 84, 97, 86, 6, 21,
54, 22, 72, 17, 44, 26, 57, 64, 11, 91, 75, 80, 95, 62, 88, 51, 39, 99, 69, 43, 68, 42, 52, 16, 4, 30, 77, 81, 60 y 50. En el conjunto 5, se usaron los genes 86, 46, 90, 79, 40, 99, 53, 67, 97, 82, 7, 15, 49, 71, 94, 48, 68, 80, 20, 51, 19, 96,
5
10
15
20
25
30
35
40
45
50
55
60
65
100, 38, 91, 83, 50, 33, 76, 66, 93, 22, 74, 85, 45, 31, 10, 62, 84, 25, 88, 77, 43, 78, 69, 24, 61, 57, 41, 56, 63, 32, 16, 59, 12, 4, 14, 28, 87, 44, 65, 55, 98, 35, 9, 64, 75, 47, 89, 18, 52, 36, 29, 54 y 81. En el conjunto 6, se usaron los genes 70, 47, 96, 46, 43, 2, 66, 39, 54, 40, 31, 84, 92, 30, 5, 75, 21, 9, 4, 24, 59, 90, 42, 44, 45, 97, 55, 69, 74, 79, 87, 86, 91, 56, 13, 98, 12, 64, 34, 99, 67, 83, 27, 68, 16, 10, 81, 61, 80, 7, 94, 82, 49, 71, 53, 15, 76, 36, 11, 19, 41,
65, 8, 28, 14, 95, 62, 51, 63, 88, 3, 60, 18, 58 y 52. En el conjunto 7, se usaron los genes 90, 80, 39, 46, 51, 91, 25,
16, 3, 36, 20, 30, 17, 99, 95, 44, 27, 89, 61, 9, 65, 19, 86, 13, 84, 14, 5, 10, 82, 67, 85, 45, 59, 81, 35, 41, 4, 71, 32,
24, 22, 6, 53, 98, 54, 66, 42, 18, 97, 94, 87, 49, 79, 56, 72, 57, 76, 69, 28, 43, 23, 11, 52, 92, 7, 93, 96, 75, 73, 8, 58,
83, 50, 29 y 68. En el conjunto 8, se usaron los genes 95, 93, 14, 43, 31, 32, 100, 6, 92, 28, 68, 99, 35, 60, 90, 70,
22, 49, 54, 94, 56, 4, 97, 85, 2, 46, 11, 50, 63, 30, 38, 76, 39, 58, 64, 67, 83, 33, 88, 79, 87, 40, 57, 27, 55, 18, 3, 29,
82, 53, 98, 91, 61, 80, 26, 84, 20, 77, 86, 51, 1, 74, 23, 19, 10, 21, 47, 69, 24, 66, 81, 96, 15, 36 y 41. En el conjunto
9, se usaron los genes 33, 41, 48, 68, 53, 45, 30, 79, 23, 70, 86, 13, 71, 92, 58, 1, 77, 26, 61, 81, 69, 14, 73, 88, 44,
87, 74, 9, 4, 12, 20, 75, 60, 57, 55, 82, 22, 94, 46, 65, 16, 19, 52, 40, 59, 66, 64, 28, 96, 91, 93, 39, 72, 5, 98, 6, 3, 62, 24, 36, 49, 31, 47, 90, 35, 89, 84, 99, 32, 11, 56, 17, 83, 51 y 97. En el conjunto 10, se usaron los genes 40, 10, 67, 9, 43, 13, 52, 73, 50, 41, 54, 56, 98, 100, 83, 85, 28, 32, 47, 66, 74, 65, 79, 81, 94, 36, 90, 69, 31, 64, 88, 99, 44,
18, 33, 75, 95, 42, 58, 92, 15, 53, 97, 34, 63, 30, 24, 3, 45, 29, 82, 48, 17, 14, 26, 49, 93, 27, 87, 6, 57, 39, 68, 12,
70, 4, 25, 91, 11, 89, 21, 23, 96, 84 y 46.
Para 80 genes, conjunto 1, se usaron los genes 75, 2, 91, 94, 19, 31, 43, 50, 96, 49, 29, 14, 93, 58, 69, 82, 28, 6, 65,
26, 66, 40, 64, 34, 33, 53, 13, 4, 37, 80, 57, 59, 1, 87, 11, 16, 83, 21, 35, 52, 25, 99, 45, 46, 36, 89, 88, 7, 39, 55, 90,
72, 17, 9, 85, 44, 22, 56, 8, 23, 18, 77, 12, 10, 48, 97, 61, 74, 92, 81, 95, 68, 47, 71, 62, 24, 70, 20, 79 y 32. En el conjunto 2, se usaron los genes 1, 34, 89, 27, 22, 77, 28, 35, 11, 7, 39, 21, 46, 49, 74, 43, 13, 75, 14, 65, 73, 92, 19,
66, 29, 81, 88, 78, 40, 32, 12, 71, 9, 44, 23, 70, 45, 10, 98, 48, 68, 55, 82, 5, 56, 59, 15, 95, 33, 99, 87, 85, 18, 97,
100, 83, 53, 63, 6, 2, 37, 17, 67, 62, 50, 42, 25, 94, 31, 69, 90, 84, 64, 16, 57, 51, 54, 80, 86 y 38. En el conjunto 3, se usaron los genes 63, 28, 35, 67, 96, 9, 12, 31, 1, 59, 22, 44, 11, 82, 6, 64, 87, 47, 21, 94, 42, 2, 72, 19, 20, 27, 89,
13, 77, 3, 16, 79, 38, 10, 80, 52, 50, 33, 25, 4, 30, 40, 32, 36, 8, 43, 26, 51, 18, 66, 61, 68, 56, 74, 53, 7, 73, 88, 49,
23, 46, 76, 92, 93, 83, 70, 24, 98, 97, 58, 65, 29, 55, 91, 95, 90, 5, 69, 86 y 78. En el conjunto 4, se usaron los genes
79, 72, 68, 31, 42, 95, 78, 36, 10, 34, 59, 91, 46, 40, 82, 1, 44, 4, 69, 3, 17, 43, 35, 63, 18, 13, 77, 81, 67, 26, 60, 86,
25, 61, 89, 76, 55, 27, 22, 29, 20, 11, 7, 30, 54, 39, 62, 8, 74, 28, 71, 12, 38, 65, 66, 64, 21, 9, 56, 16, 88, 99, 96, 32,
94, 51, 90, 37, 87, 92, 97, 70, 41, 57, 50, 45, 83, 24, 48 y 58. En el conjunto 5, se usaron los genes 100, 69, 33, 24,
83, 84, 97, 22, 40, 45, 17, 3, 43, 52, 50, 30, 8, 99, 9, 46, 7, 14, 35, 61, 15, 16, 64, 6, 23, 41, 60, 63, 96, 98, 38, 36,
49, 13, 76, 85, 87, 71, 66, 56, 80, 20, 34, 29, 57, 91, 81, 78, 27, 88, 37, 94, 51, 5, 1, 74, 44, 70, 58, 25, 19, 89, 39,
47, 65, 62, 68, 95, 18, 75, 79, 59, 2, 10, 73 y 53. En el conjunto 6, se usaron los genes 69, 100, 3, 35, 58, 56, 96, 43,
39, 50, 61, 36, 71, 95, 30, 18, 90, 63, 21, 31, 94, 46, 44, 23, 7, 10, 88, 49, 9, 53, 25, 54, 2, 97, 82, 75, 68, 48, 26, 91,
70, 65, 51, 19, 84, 29, 47, 12, 99, 85, 20, 16, 5, 22, 73, 93, 92, 89, 62, 81, 77, 41, 83, 1, 72, 27, 15, 79, 67, 37, 11,
64, 87, 86, 80, 74, 55, 8, 13 y 60. En el conjunto 7, se usaron los genes 67, 73, 85, 95, 92, 60, 29, 28, 24, 90, 72, 71,
37, 76, 27, 78, 53, 34, 98, 70, 87, 33, 5, 41, 42, 68, 62, 82, 100, 96, 69, 65, 6, 91, 21, 38, 3, 80, 25, 75, 31, 52, 79,
20, 84, 83, 19, 86, 57, 9, 77, 58, 64, 97, 14, 8, 50, 2, 51, 94, 56, 46, 35, 93, 7, 39, 1, 88, 59, 17, 48, 74, 32, 81, 99,
16, 11, 49, 13 y 30. En el conjunto 8, se usaron los genes 80, 52, 14, 42, 21, 76, 32, 69, 30, 60, 86, 61, 48, 24, 67, 92, 16, 75, 93, 2, 6, 99, 20, 73, 9, 97, 98, 56, 47, 12, 35, 26, 36, 41, 96, 55, 11, 84, 7, 87, 4, 70, 79, 88, 44, 17, 50,
27, 89, 28, 29, 43, 77, 39, 8, 15, 91, 65, 22, 71, 53, 37, 34, 95, 83, 45, 68, 1, 18, 13, 31, 85, 3, 90, 51, 49, 19, 66, 63 y
54. En el conjunto 9, se usaron los genes 91, 22, 68, 85, 53, 89, 10, 77, 97, 4, 7, 33, 46, 51, 14, 76, 82, 62, 17, 3, 65,
70, 84, 75, 31, 50, 73, 63, 19, 52, 42, 26, 23, 47, 96, 2, 64, 56, 9, 54, 38, 93, 13, 90, 86, 8, 59, 57, 79, 28, 21, 88, 5,
66, 1, 94, 55, 35, 15, 87, 74, 32, 27, 92, 72, 18, 69, 80, 37, 67, 71, 34, 95, 99, 40, 83, 30, 81, 48 y 39. En el conjunto
10, se usaron los genes 92, 76, 86, 5, 20, 1, 48, 42, 62, 29, 12, 7, 37, 46, 47, 82, 32, 66, 97, 77, 56, 91, 30, 80, 36, 72, 17, 31, 2, 81, 23, 28, 51, 55, 98, 40, 95, 13, 10, 58, 33, 21, 14, 74, 85, 88, 22, 75, 94, 27, 43, 3, 100, 61, 67, 4, 25, 6, 44, 60, 24, 93, 63, 89, 70, 41, 15, 11, 53, 87, 16, 65, 52, 68, 57, 99, 50, 45, 71 y 38.
Para 85 genes, conjunto 1, se usaron los genes 38, 35, 85, 59, 17, 7, 31, 58, 96, 97, 16, 70, 82, 42, 21, 54, 88, 34,
63, 4, 27, 29, 3, 19, 69, 36, 9, 99, 74, 86, 76, 24, 15, 81, 73, 93, 40, 52, 26, 57, 37, 87, 55, 90, 41, 79, 45, 77, 91, 71,
61, 11, 94, 83, 25, 48, 1, 5, 8, 22, 33, 46, 60, 56, 20, 44, 89, 18, 10, 23, 78, 65, 50, 72, 75, 47, 98, 28, 66, 68, 32, 12,
51, 13 y 100. En el conjunto 2, se usaron los genes 32, 90, 94, 21, 77, 63, 17, 27, 62, 41, 35, 81, 100, 14, 45, 69, 3,
75, 34, 76, 65, 15, 95, 86, 39, 92, 89, 24, 57, 4, 54, 50,. 58, 88, 5, 56, 22, 59, 6, 52, 28, 1, 9, 40, 98, 99, 91, 19, 8, 23, 96, 2, 73, 67, 7, 25, 53, 12, 44, 18, 13, 87, 60, 49, 93, 55, 20, 72, 42, 66, 30, 80, 33, 26, 64, 46, 84, 31, 70, 61, 71, 83, 38, 36 y 29. En el conjunto 3, se usaron los genes 88, 20, 1, 58, 53, 32, 65, 34, 50, 75, 71, 36, 59, 39, 30, 61, 8,
62, 14, 3, 94, 66, 35, 37, 17, 47, 77, 60, 4, 80, 74, 28, 97, 87, 93, 33, 64, 48, 29, 18, 49, 21, 56, 69, 22, 25, 43, 54,
91, 7, 81, 79, 12, 85, 96, 40, 63, 52, 82, 86, 41, 24, 44, 84, 70, 6, 15, 38, 57, 16, 55, 90, 76, 42, 51, 23, 11, 67, 45,
98, 19, 10, 27, 2 y 31. En el conjunto 4, se usaron los genes 64, 86, 54, 83, 47, 21, 67, 57, 73, 23, 71, 76, 56, 9, 44, 75, 82, 11, 8, 99, 72, 13, 79, 28, 92, 5, 27, 90, 24, 91, 33, 68, 51, 60, 94, 58, 78, 48, 18, 42, 53, 98, 70, 32, 41, 49,
45, 6, 30, 63, 95, 80, 36, 87, 97, 65, 77, 3, 26, 35, 59, 40, 84, 37, 61, 81, 39, 46, 22, 1, 2, 50, 25, 69, 4, 43, 15, 29,
20, 17, 88, 10, 38, 100 y 19. En el conjunto 5, se usaron los genes 11, 92, 15, 42, 33, 19, 6, 57, 23, 87, 31, 5, 30, 21, 54, 51, 14, 68, 97, 34, 59, 24, 20, 50, 29, 65, 13, 80, 16, 73, 8, 25, 47, 55, 27, 45, 100, 96, 85, 38, 37, 81, 44, 4, 9, 70, 98, 77, 48, 35, 28, 79, 41, 71, 86, 61, 2, 49, 60, 67, 66, 69, 72, 3, 83, 26, 1, 89, 17, 39, 52, 10, 32, 75, 82, 99, 40,
95, 90, 53, 22, 91, 62, 78 y 56. En el conjunto 6, se usaron los genes 87, 32, 4, 63, 15, 81, 92, 10, 74, 44, 7, 23, 89,
93, 28, 59, 50, 72, 30, 60, 54, 71, 39, 12, 21, 85, 40, 37, 68, 64, 97, 66, 52, 67, 98, 91, 1, 83, 61, 6, 24, 38, 86, 77,
26, 88, 43, 100, 48, 20, 14, 31, 82, 9, 13, 62, 55, 45, 57, 11, 27, 90, 25, 80, 17, 5, 94, 42, 53, 49, 29, 99, 78, 2, 84,
73, 58, 75, 18, 19, 65, 3, 47, 41 y 36. En el conjunto 7, se usaron los genes 56, 38, 23, 74, 34, 99, 93, 4, 13, 18, 61,
5
10
15
20
25
30
35
40
45
50
55
60
65
49, 20, 5, 76, 88, 91, 31, 78, 32, 1, 89, 12, 16, 51, 54, 81, 70, 86, 97, 66, 19, 59, 39, 8, 80, 73, 35, 71, 77, 24, 53, 68,
33, 62, 69, 43, 41, 15, 94, 44, 52, 29, 100, 55, 36, 27, 25, 67, 21, 96, 30, 42, 92, 11, 3, 45, 63, 72, 57, 47, 46, 75, 90,
2, 48, 14, 6, 9, 87, 22, 98, 95, 84 y 65. En el conjunto 8, se usaron los genes 79, 64, 71, 18, 37, 40, 54, 34, 26, 65,
39, 67, 14, 62, 95, 11, 49, 92, 59, 48, 6, 12, 57, 9, 20, 81, 16, 50, 38, 33, 100, 47, 63, 3, 84, 87, 35, 98, 56, 93, 66, 23, 2, 29, 90, 78, 85, 60, 19, 72, 97, 36, 13, 94, 25, 45, 41, 27, 69, 52, 8, 68, 46, 30, 1, 96, 7, 83, 80, 4, 99, 15, 76, 10, 58, 89, 88, 51, 55, 82, 53, 28, 44, 73 y 77. En el conjunto 9, se usaron los genes 35, 85, 81, 4, 20, 88, 66, 74, 13,
36, 6, 24, 95, 97, 2, 21, 90, 57, 89, 42, 73, 79, 64, 59, 46, 68, 92, 67, 82, 28, 56, 14, 65, 99, 39, 38, 8, 62, 61, 78, 11,
48, 93, 91, 29, 33, 76, 16, 69, 47, 84, 94, 7, 54, 30, 32, 23, 70, 52, 43, 51, 41, 60, 100, 27, 63, 75, 77, 80, 5, 3, 44, 10, 87, 40, 71, 37, 72, 1, 53, 22, 83, 49, 17 y 34. En el conjunto 10, se usaron los genes 23, 39, 86, 48, 65, 73, 24,
27, 61, 37, 99, 64, 58, 74, 3, 22, 57, 60, 13, 93, 44, 100, 66, 69, 38, 83, 6, 81, 59, 36, 68, 95, 71, 70, 84, 62, 96, 26,
30, 32, 20, 54, 80, 19, 97, 16, 4, 77, 12, 5, 35, 29, 18, 52, 53, 87, 98, 90, 10, 75, 72, 55, 50, 88, 28, 34, 41, 94, 11, 76, 7, 45, 31, 46, 49, 9, 82, 17, 79, 1, 25, 40, 67, 47 y 85.
Para 90 genes, conjunto 1, se usaron los genes 79, 5, 27, 100, 96, 11, 32, 63, 42, 68, 13, 65, 88, 75, 17, 64, 82, 72,
37, 45, 98, 2, 90, 94, 1, 87, 73, 86, 69, 92, 3, 25, 29, 84, 60, 50, 39, 4, 95, 47, 12, 10, 33, 22, 77, 71, 57, 97, 38, 89,
91, 53, 51, 9, 67, 44, 7, 78, 34, 85, 15, 41, 54, 49, 62, 76, 83, 46, 59, 23, 24, 8, 14, 26, 30, 52, 18, 6, 66, 31, 20, 93,
36, 16, 61, 28, 74, 43, 56 y 48. En el conjunto 2, se usaron los genes 95, 28, 46, 62, 91, 99, 53, 65, 66, 60, 22, 29,
50, 2, 93, 33, 54, 57, 92, 24, 9, 4, 69, 5, 8, 58, 88, 43, 6, 100, 51, 18, 16, 45, 81, 44, 68, 14, 59, 82, 63, 73, 30, 86,
98, 13, 84, 94, 1, 55, 38, 83, 3, 37, 11, 89, 77, 85, 26, 97, 12, 21, 40, 96, 56, 41, 10, 42, 64, 17, 76, 27, 49, 20, 87,
34, 75, 15, 74, 35, 19, 31, 39, 48, 23, 67, 78, 32, 7 y 80. En el conjunto 3, se usaron los genes 88, 89, 6, 94, 17, 60,
8, 76, 45, 90, 47, 80, 15, 85, 51, 5, 46, 36, 65, 4, 25, 67, 78, 77, 97, 23, 11, 40, 61, 53, 39, 12, 38, 21, 59, 55, 32, 34,
71, 69, 20, 50, 93, 3, 30, 29, 75, 73, 49, 98, 58, 43, 18, 95, 42, 82, 66,16, 33, 37, 92, 52, 56, 41, 87, 99, 74, 24, 86,
48, 81, 57, 83, 26, 79, 68, 13, 63, 72, 9, 70, 14, 54, 100, 64, 19, 96, 7, 31 y 2. En el conjunto 4, se usaron los genes
19, 33, 41, 40, 70, 51, 14, 48, 42, 12, 90, 4, 32, 60, 89, 64, 45, 86, 73, 16, 50, 5, 9, 72, 81, 3, 27, 87, 76, 58, 29, 31,
13, 21, 55, 18, 6, 62, 56, 96, 47, 63, 37, 98, 28, 91, 36, 82, 39, 100, 68, 25, 88, 11, 93, 35, 66, 24, 43, 59, 8, 65, 74, 30, 10, 22, 17, 99, 49, 44, 26, 54, 2, 80, 94, 57, 71, 38, 67, 79, 75, 77, 23, 85, 61, 52, 83, 7, 78 y 53. En el conjunto 5, se usaron los genes 49, 55, 13, 97, 59, 83, 61, 34, 80, 19, 12, 65, 86, 72, 89, 25, 39, 77, 82, 47, 22, 48, 20, 11, 23, 84, 31, 4, 54, 91, 8, 87, 33, 14, 32, 45, 68, 27, 51, 28, 96, 1, 100, 92, 37, 29, 64, 15, 7, 98, 60, 53, 17, 69, 24, 75, 81, 74, 5, 18, 26, 78, 62, 94, 88, 46, 73, 44, 63, 52, 9, 93, 76, 6, 95, 99, 42, 50, 66, 38, 90, 70, 35, 57, 85, 58, 16, 43, 30 y
10. En el conjunto 6, se usaron los genes 81, 52, 60, 16, 18, 40, 67, 47, 58, 51, 26, 5, 53, 34, 24, 68, 14, 43, 49, 69,
99, 73, 29, 96, 37, 62, 66, 38, 88, 48, 11, 50, 79, 74, 15, 39, 83, 57, 94, 95, 100, 12, 84, 10, 33, 3, 93, 91, 17, 46, 59, 86, 7, 9, 71, 19, 22, 80, 27, 97, 4, 75, 89, 21, 78, 85, 63, 61, 77, 31, 32, 56, 6, 72, 92, 55, 76, 90, 36, 35, 98, 1, 82, 25, 23, 44, 65, 64, 28 y 42. En el conjunto 7, se usaron los genes 51, 1, 54, 94, 93, 56, 22, 29, 53, 67, 88, 82, 16, 44, 65, 21, 14, 35, 48, 91, 12, 97, 31, 74, 6, 99, 86, 26, 28, 19, 72, 58, 24, 34, 5, 38, 81, 11, 49, 39, 3, 89, 75, 64, 96, 52, 59, 69, 42, 78, 33, 100, 2, 25, 66, 77, 90, 40, 71, 9, 4, 57, 13, 36, 10, 50, 17, 87, 15, 47, 60, 46, 63, 68, 70, 23, 80,
37, 30, 92, 7, 32, 27, 43, 98, 84, 8, 61, 73 y 41. En el conjunto 8, se usaron los genes 53, 63, 17, 43, 6, 44, 95, 58, 78, 13, 3, 15, 28, 41, 12, 93, 2, 92, 23, 42, 62, 57, 33, 8, 65, 49, 80, 81, 50, 71, 74, 39, 4, 70, 77, 51, 84, 21, 30, 36, 46, 75, 47, 94, 16, 67, 55, 1, 26, 52, 60, 19, 59, 90, 96, 14, 87, 37, 40, 66, 88, 73, 29, 10, 5, 56, 100, 45, 31, 34, 22,
64, 91, 54, 48, 25, 98, 61, 18, 72, 69, 27, 68, 99, 83, 35, 24, 82, 85 y 38. En el conjunto 9, se usaron los genes 62,
91, 49, 28, 69, 38, 19, 35, 89, 3, 24, 79, 32, 12, 47, 40, 39, 50, 86, 6, 44, 65, 33, 70, 16, 41, 21, 53, 72, 74, 87, 14,
51, 7, 60, 67, 100, 42, 93, 36, 2, 57, 76, 20, 25, 27, 95, 18, 73, 97, 54, 99, 63, 66, 96, 22, 77, 56, 90, 81, 61, 17, 48,
23, 15, 4, 30, 45, 59, 8, 71, 52, 85, 92, 46, 98, 64, 94, 75, 83, 13, 26, 43, 84, 5, 1, 29, 68, 82 y 31. En el conjunto 10,
se usaron los genes 45, 10, 63, 9, 18, 7, 70, 50, 22, 52, 91, 88, 5, 38, 17, 80, 54, 92, 20, 19, 24, 8, 13, 40, 15, 21, 87,
72, 12, 14, 2, 53, 46, 93, 4, 44, 99, 76, 47, 32, 60, 27, 23, 81, 78, 68, 36, 71, 64, 30, 95, 82, 90, 26, 74, 86, 100, 89, 62, 37, 66, 35, 83, 94, 31, 43, 65, 84, 11, 67, 25, 33, 61, 79, 97, 16, 75, 73, 98, 57, 28, 59, 1, 96, 51, 41, 69, 3, 56 y
55.
Para 95 genes, conjunto 1, se usaron los genes 35, 64, 32, 25, 20, 69, 88, 42, 97, 6, 23, 86, 98, 93, 16, 44, 53, 51, 91, 21, 70, 73, 31, 81, 74, 14, 29, 66, 4, 87, 11, 94, 52, 95, 56, 63, 18, 8, 78, 100, 62, 99, 39, 89, 17, 50, 71, 10, 90,
65, 84, 83, 60, 48, 22, 5, 92, 13, 15, 24, 27, 37, 57, 33, 38, 82, 3, 9, 30, 1, 34, 7, 40, 68, 67, 58, 28, 47, 46, 19, 12,
43, 41, 61, 76, 96, 72, 36, 75, 54, 45, 80, 49, 79 y 55. En el conjunto 2, se usaron los genes 58, 44, 39, 62, 1, 19, 61,
33, 84, 36, 91, 21, 53, 30, 63, 35, 92, 45, 11, 87, 10, 82, 96, 64, 8, 32, 42, 78, 69, 59, 24, 72, 48, 66, 15, 27, 49, 75,
40, 47, 57, 52, 31, 95, 97, 94, 26, 5, 93, 34, 60, 81, 88, 29, 23, 67, 76, 6, 98, 37, 74, 43, 100, 20, 18, 12, 13, 51, 41,
54, 14, 2, 68, 99, 3, 38, 70, 77, 50, 4, 17, 22, 9, 83, 71, 85, 25, 79, 46, 86, 7, 73, 16, 65 y 28. En el conjunto 3, se usaron los genes 15, 4, 25, 94, 92, 77, 78, 70, 17, 52, 36, 23, 44, 98, 39, 99, 59, 50, 75, 16, 82, 48, 18, 90, 10, 72, 8,
34, 9, 19, 1, 57, 93, 46, 54, 69, 32, 21, 81, 91, 28, 38, 68, 3, 41, 47, 87, 63, 24, 13, 84, 5, 65, 67, 74, 62, 85, 12, 53,
30, 73, 51, 2, 80, 29, 26, 83, 43, 55, 86, 88, 89, 35, 66, 31, 96, 100, 58, 60, 14, 6, 61, 49, 22, 20, 27, 7, 64, 37, 45, 97, 95, 40, 71 y 11. En el conjunto 4, se usaron los genes 21, 78, 42, 23, 84, 10, 64, 36, 48, 26, 79, 71, 72, 39, 49,
56, 44, 20, 47, 82, 63, 1, 91, 2, 8, 40, 96, 18, 68, 9, 57, 28, 100, 89, 60, 75, 70, 73, 25, 15, 46, 85, 86, 97, 32, 94, 65,
90, 74, 98, 16, 45, 3, 6, 31, 77, 41, 11, 12, 35, 95, 93, 53, 50, 30, 61, 81, 92, 80, 54, 13, 38, 58, 14, 52, 22, 76, 83, 5, 17, 37, 69, 66, 87, 19, 88, 51, 34, 59, 99, 24, 33, 27, 4 y 62. En el conjunto 5, se usaron los genes 29, 34, 28, 58, 89, 1, 73, 30, 92, 76, 68, 33, 38, 8, 49, 3, 42, 9, 40, 36, 43, 81, 97, 59, 7, 79, 54, 15, 11, 61, 18, 82, 100, 41, 52, 23, 31, 13, 57, 66, 65, 27, 72, 44, 16, 69, 39, 26, 2, 55, 71, 80, 86, 77, 12, 25, 14, 50, 88, 22, 93, 51, 75, 64, 47, 62, 96, 10,
35, 5, 67, 60, 32, 84, 94, 48, 56, 90, 95, 83, 21, 6, 37, 91, 46, 70, 24, 87, 85, 17, 98, 99, 45, 19 y 63. En el conjunto 6, se usaron los genes 36, 34, 46, 2, 5, 77, 91, 59, 61, 29, 9, 85, 52, 16, 17, 60, 51, 95, 69, 58, 57, 23, 82, 33, 18, 45, 43, 49, 90, 1, 94, 93, 47, 37, 35, 63, 27, 96, 32, 15, 25, 86, 55, 24, 26, 71, 48, 7, 28, 79, 11, 44, 76, 3, 68, 88, 62, 73,
5
10
15
20
25
30
35
40
45
50
55
60
65
54, 39, 22, 13, 75, 19, 66, 98, 70, 10, 83, 100, 42, 31, 38, 4, 92, 78, 99, 97, 56, 21, 20, 6, 72, 40, 65, 67, 53, 30, 8,
14, 84, 50, 12, 80 y 81. En el conjunto 7, se usaron los genes 26, 7, 14, 64, 91, 50, 8, 48, 23, 29, 34, 28, 9, 20, 74,
97, 27, 63, 25, 66, 60, 43, 92, 61, 58, 46, 68, 49, 21, 98, 2, 41, 52, 1, 51, 77, 53, 69, 36, 93, 62, 55, 17, 38, 31, 40,
76, 54, 71, 5, 99, 83, 82, 78, 42, 15, 24, 70, 84, 100, 73, 10, 59, 33, 96, 4, 56, 3, 94, 75, 90, 13, 32, 65, 89, 79, 19,
30, 11, 87, 37, 95, 12, 6, 88, 80, 18, 47, 81, 72, 44, 16, 86, 85 y 67. En el conjunto 8, se usaron los genes 24, 84, 92,
71, 56, 68, 93, 67, 59, 75, 85, 35, 72, 86, 39, 46, 65, 51, 23, 100, 8, 37, 70, 69, 57, 27, 17, 87, 44, 1, 2, 50, 9, 91, 63,
29, 95, 3, 5, 40, 96, 47, 54, 64, 66, 18, 28, 13, 14, 36, 80, 21, 12, 61, 48, 26, 88, 83, 7, 43, 42, 97, 99, 41, 10, 16, 94, 53, 45, 98, 5, 73, 89, 55, 74, 81, 20, 90, 79, 34, 38, 82, 76, 4, 60, 33, 31, 78, 58, 62, 22, 6, 52, 49 y 19. En el conjunto 9, se usaron los genes 99, 77, 10, 92, 24, 43, 41, 15, 46, 78, 38, 19, 2, 5, 3, 81, 82, 22, 56, 63, 47, 90, 33, 34, 75,
100, 62, 6S, 13, 30, 95, 98, 94, 25, 67, 11, 6, 66, 14, 48, 93, 4, 21, 89, 35, 68, 97, 45, 27, 59, 76, 85, 42, 49, 23, 40,
37, 74, 26, 52, 8, 91, 53, 57, 58, 86, 31, 20, 9, 16, 84, 69, 96, 44, 32, 54, 60, 7, 51, 83, 72, 28, 29, 61, 80, 55, 64, 17,
18, 70, 50, 1, 12, 73 y 39. En el conjunto 10, se usaron los genes 76, 1, 12, 25, 77, 24, 100, 17, 66, 65, 26, 29, 60, 91, 63, 52, 6, 30, 8, 72, 82, 68, 15, 16, 54, 43, 59, 34, 89, 20, 44, 87, 70, 56, 3, 28, 74, 86, 7, 2, 33, 35, 46, 67, 58,
22, 49, 21, 75, 14, 27, 64, 90, 42, 73, 36, 97, 40, 11, 37, 51, 19, 83, 45, 47, 50, 55, 23, 80, 61, 95, 71, 78, 32, 81, 93,
98, 62, 92, 99, 9, 4, 53, 84, 18, 13, 41, 57, 88, 5, 79, 38, 39, 31 y 94.
La clasificación de subconjuntos de los 39 tipos tumorales se realizó con el uso de selecciones aleatorias de tipos tumorales del grupo de 39. Los niveles de expresión de conjuntos de secuencias génicas como se describe en el presente documento se usaron para clasificar combinaciones aleatorias de tipos tumorales. Se usaron diferentes conjuntos aleatorios de tipos tumorales con cada uno de los conjuntos de 100, 74 y 90 secuencias génicas como se describe en estos ejemplos. Son ejemplos representativos y no limitantes, de conjuntos aleatorios de 2 a 20 tipos tumorales usados los siguientes, en los que el conjunto de 39 tipos tumorales se catalogó de 1 a 39.
Para 2 tipos tumorales, el conjunto 1 usó los tipos 26 y 16. El conjunto 2 usó los tipos 8 y 5. El conjunto 3 usó los tipos 39 y 8. El conjunto 4 usó los tipos 27 y 23. El conjunto 5 usó los tipos 8 y 19. El conjunto 6 usó 12 y 21. El conjunto 7 usó los tipos 30 y 15. El conjunto 8 usó los tipos 30 y 5. El conjunto 9 usó los tipos 18 y 22. El conjunto 10 usó los tipos 27 y 26.
Para 4 tipos tumorales, el conjunto 1 usó los tipos 20, 35, 15 y 7. El conjunto 2 usó los tipos 36, 1, 28 y 19. El conjunto 3 usó los tipos 13, 4, 12 y 21. El conjunto 4 usó los tipos 12, 33, 14 y 28. El conjunto 5 usó los tipos 6, 28, 5 y 37. El conjunto 6 usó los tipos 5, 25, 36 y 15. El conjunto 7 usó los tipos 12, 26, 21 y 19. El conjunto 8 usó los tipos
19, 3, 20 y 17. El conjunto 9 usó los tipos 18, 10, 8 y 9. El conjunto 10 usó los tipos 28, 20, 2 y 22.
Para 6 tipos tumorales, el conjunto 1 usó los tipos 27, 3, 10, 39, 11 y 20. El conjunto 2 usó los tipos 33, 10, 20, 32, 13 y 19. El conjunto 3 usó los tipos 31, 27, 18, 39, 8 y 16. El conjunto 4 usó los tipos 25, 28, 10, 12, 7 y 39. El conjunto 5 usó los tipos 14, 13, 28, 24, 30 y 36. El conjunto 6 usó los tipos 9, 24, 8, 17, 36 y 26. El conjunto 7 usó los tipos 20, 1, 34, 26, 6 y 19. El conjunto 8 usó los tipos 12, 13, 3, 17, 34 y 22. El conjunto 9 usó los tipos 7, 1, 17, 13, 20 y 34. El conjunto 10 usó los tipos 5, 11, 25, 29, 28 y 35.
Para 8 tipos tumorales, el conjunto 1 usó los tipos 34, 33, 28, 3, 23, 25, 9 y 29. El conjunto 2 usó los tipos 27, 8, 38, 28, 20, 14, 12 y 9. El conjunto 3 usó los tipos 29, 21, 19, 1, 13, 26, 11 y 31. El conjunto 4 usó los tipos 25, 17, 7, 20, 34, 8, 28 y 10. El conjunto 5 usó los tipos 36, 28, 35, 26, 2, 8, 29 y 7. El conjunto 6 usó los tipos 10, 23, 2, 27, 33, 21, 25 y 35. El conjunto 7 usó los tipos 10, 18, 38, 2, 6, 7, 19 y 32. El conjunto 8 usó los tipos 11, 37, 6, 28, 3, 9, 2 y 16. El conjunto 9 usó los tipos 22, 2, 10, 8, 17, 19 y 33. El conjunto 10 usó los tipos 35, 39, 8, 10, 37, 4, 36 y 6.
Para 10 tipos tumorales, el conjunto 1 usó los tipos 25, 10, 26, 2, 32, 31, 39, 23, 22 y 18. El conjunto 2 usó los tipos 12, 35, 6, 16, 20, 3, 39, 36, 11 y 2. El conjunto 3 usó los tipos 34, 1, 15, 29, 5, 39, 2, 12, 25 y 18. El conjunto 4 usó los tipos 10, 8, 14, 18, 31, 19, 23, 20, 32 y 33. El conjunto 5 usó los tipos 10, 18, 37, 15, 4, 35, 33, 24, 39 y 20. El conjunto 6 usó los tipos 22, 16, 4, 3, 18, 21, 1, 25, 37 y 13. El conjunto 7 usó los tipos 14, 6, 28, 18, 11, 13, 2, 32, 33 y 19. El conjunto 8 usó los tipos 39, 2, 38, 4, 34, 8, 25, 6, 32 y 35. El conjunto 9 usó los tipos 3, 10, 11, 16, 6, 15, 18, 14, 12 y 26. El conjunto 10 usó los tipos 24, 25, 21, 9, 36, 29, 20, 39, 10 y 37.
Para 12 tipos tumorales, el conjunto 1 usó los tipos 26, 20, 4, 12, 2, 31, 38, 18, 16, 39, 3 y 33. El conjunto 2 usó los tipos 25, 16, 4, 9. 29, 27, 14, 24, 21, 7, 23 y 2. El conjunto 3 usó los tipos 31, 18, 23, 13, 25, 1, 29, 21, 35, 10, 32 y 39. El conjunto 4 usó los tipos 8, 34, 23, 9, 35, 14, 25, 21, 2, 33, 18 y 28. El conjunto 5 usó los tipos 6, 11, 21, 8, 5, 7, 19, 32, 3, 13, 36 y 9. El conjunto 6 usó los tipos 12, 33, 14, 26, 27, 15, , 2, 21, 36, 35, 9 y 39. El conjunto 7 usó los tipos 26, 29, 32, 17, 31, 19, 6, 5, 20, 34, 2 y 24. El conjunto 8 usó los tipos 17, 12, 8, 22, 28, 9, 27, 29, 14, 35, 4 y 32.
El conjunto 9 usó los tipos 29, 9, 36, 23, 33, 18, 21, 35, 3, 6, 2 y 1. El conjunto 10 usó los tipos 1, 3, 35, 29, 22, 27, 8,
23, 2, 36, 14 y 19.
Para 14 tipos tumorales, el conjunto 1 usó los tipos 9, 26, 38, 25, 31, 3, 15, 14, 17, 33, 12, 35, 39 y 16. El conjunto 2 usó los tipos 1, 26, 16, 25, 20, 12, 14, 37, 38, 24, 23, 33, 27 y 35. El conjunto 3 usó los tipos 11, 21, 35, 38, 32, 34, 27, 39, 16, 15, 4, 5, 13 y 18. El conjunto 4 usó los tipos 27, 5, 13, 28, 18, 17, 15, 20, 29, 37, 21, 36, 25 y 14. El conjunto 5 usó los tipos 5, 12, 17, 9, 25, 21, 33, 37, 8, 15, 24, 3, 34 y 28. El conjunto 6 usó los tipos 11, 19, 34, 26, 9,
6, 32, 14, 27, 29, 30, 16, 24 y 17. El conjunto 7 usó los tipos 31, 26, 11, 18, 19, 20, 9, 8, 5, 36, 12, 6, 27 y 38. El
conjunto 8 usó los tipos 20, 17, 11, 5, 15, 9, 2, 39, 34, 24, 27, 26, 35 y 10. El conjunto 9 usó los tipos 1, 14, 39, 30,
5
10
15
20
25
30
35
40
45
50
55
60
65
17, 6, 10, 35, 31, 33, 15, 29, 32 y 7. El conjunto 10 usó los tipos 1, 19, 24, 28, 34, 12, 13, 18, 32, 11, 14, 21, 22 y 25.
Para 16 tipos tumorales, el conjunto 1 usó los tipos 27, 15, 8, 12, 6, 20, 26, 19, 25, 2, 37, 38, 7, 39, 4 y 33. El conjunto 2 usó los tipos 17, 18, 28, 5, 6, 31, 25, 13, 8, 20, 37, 36, 35, 9, 23 y 27. El conjunto 3 usó los tipos 23, 37, 34, 14, 16, 27, 32, 33, 21, 38, 4, 30, 24, 22, 17 y 25. El conjunto 4 usó los tipos 7, 37, 38, 21, 34, 31, 32, 25, 10, 36, 19, 11, 6, 26, 18 y 35. El conjunto 5 usó los tipos 9, 32, 12, 24, 20, 13, 38, 21, 39, 23, 36, 18, 37, 22, 5 y 3. El conjunto 6 usó los tipos 14, 21, 5, 17, 6, 20, 18, 35, 22, 10, 3, 23, 13, 2, 34 y 26. El conjunto 7 usó los tipos 1, 8, 19, 6, 9, 39, 28, 18, 13, 31, 14, 16, 37, 12, 3 y 25. El conjunto 8 usó los tipos 32, 36, 28, 38, 9, 33, 2, 5, 4, 11, 19, 18, 13, 8, 12 y 3. El conjunto 9 usó los tipos 9, 14, 10, 5, 28, 32, 23, 6, 39, 3, 17, 8, 19, 1, 31 y 12. El conjunto 10 usó los tipos 4, 34, 11, 6, 38, 19, 7, 20, 23, 3, 25, 37, 26, 1, 15 y 12.
Para 18 tipos tumorales, el conjunto 1 usó los tipos 15, 24, 39, 35, 7, 30, 16, 13, 20, 3, 26, 4, 12, 10, 34, 25, 21 y 28. El conjunto 2 usó los tipos 21, 23, 29, 11, 10, 19, 13, 28, 4, 20, 17, 24, 30, 12, 39, 34, 31 y 9. El conjunto 3 usó los tipos 7, 17, 27, 6, 30, 8, 22, 2, 32, 26, 21, 14, 4, 38, 1, 35, 16 y 28. El conjunto 4 usó los tipos 17, 13, 20, 33, 10, 3,
16, 22, 1, 38, 2, 9, 28, 5, 6, 19, 12 y 11. El conjunto 5 usó los tipos 4, 35, 21, 25, 18, 17, 8, 14, 31, 30, 9, l, 2, 23, 36, 29, 32 y 37. El conjunto 6 usó los tipos 17, 34, 2, 18, 19, 15, 16, 13, 4, 24, 5, 35, 6, 22, 28, 37, 38 y 1. El conjunto 7 usó los tipos 34, 26, 12, 25, 27, 3, 17, 7, 2, 32, 9, 36, 21, 19, 22, 8, 20 y 29. El conjunto 8 usó los tipos 12, 34, 38, 25,
17, 22, 14, 39, 10, 7, 31, 2, 3, 11, 29, 30, 16 y 24. El conjunto 9 usó los tipos 13, 26, 27, 14, 5, 10, 8, 7, 16, 30, 37, 4, 6, 35, 28, 1, 36 y 20. El conjunto 10 usó los tipos 15, 2, 17, 23, 26, 28, 36, 38, 12, 6, 19, 37, 20, 14, 9, 39, 11 y 21.
Para 20 tipos tumorales, el conjunto 1 usó los tipos 25, 13, 21, 15, 37, 20, 12, 28, 9, 10, 26, 22, 14, 24, 16, 7, 39, 34, 33 y 4. El conjunto 2 usó los tipos 20, 17, 10, 27, 19, 28, 5, 1, 23, 21, 38, 7, 13, 22, 32, 31, 9, 4, 3 y 24. El conjunto 3 usó los tipos 17, 13, 7, 20, 11, 38, 34, 3, 15, 12, 5, 39, 9, 10, 4, 35, 27, 6, 21 y 33. El conjunto 4 usó los tipos 6, 13,
17, 26, 1, 7, 33, 5, 10, 32, 3, 23, 35, 4, 14, 28, 12, 38, 8 y 27. El conjunto 5 usó los tipos 10, 23, 9, 38, 5, 29, 12, 27, 25, 6, 7, 26, 37, 31, 24, 36, 19, 15, 16 y 11. El conjunto 6 usó los tipos 30, 24, 21, 11, 23, 25, 8, 9, 7, 31, 27, 5, 14,
29, 1, 19, 16, 12, 22 y 17. El conjunto 7 usó los tipos 26, 13, 23, 19, 22, 11, 25, 21, 33, 20, 6, 17, 2, 10, 31, 34, 27, 37, 7 y 9. El conjunto 8 usó los tipos 30, 1, 38, 7, 31, 37, 11, 25, 6, 19, 28, 33, 17, 29, 10, 27, 16, 3, 14 y 15. El conjunto 9 usó los tipos 15, 19, 26, 24, 5, 33, 11, 2, 13, 18, 31, 22, 32, 20, 23, 6, 10, 25, 36 y 3. El conjunto 10 usó los tipos 24, 25, 21, 29, 14, 18, 31, 2, 20, 39, 23, 9, 38, 12, 6, 32, 22, 26, 33 y 7.
Ejemplo 4. Conjuntos de genes especificados
Se usó en la práctica de la invención un primer conjunto de 74 genes y un segundo conjunto de 90 genes, en los que los dos conjuntos tenían 38 miembros en común. El rendimiento de los dos conjuntos frente a diversos números de tipos tumorales se muestra en la Figura 3.
Se evaluaron subconjuntos aleatorios de 50 a todos los miembros del conjunto de 74 secuencias génicas expresadas de una manera análoga a la descrita en el Ejemplo 3. De nuevo, los niveles de expresión de combinaciones aleatorias de 50, 55, 60, 65, 70 y las 74 (cada combinación muestreada 10 veces) de las 74 secuencias expresadas se usaron con datos de tipos tumorales y después se usaron para predecir conjuntos aleatorios de ensayo de muestras tumorales (cada una muestreada 10 veces) que variaban de 2 a los 39 tipos. Los datos resultantes se muestran en las Figuras 4 y 5.
Los miembros de las 74 secuencias génicas se catalogaron de 1 a 74 y los conjuntos aleatorios representativos usados en la invención son los siguientes:
Para 50-genes, conjunto 1, se usaron los genes 69, 64, 74, 29, 4, 57, 30, 72, 36, 59, 42, 47, 11, 33, 60, 35, 39, 10, 50, 49, 41, 12, 34, 51, 32, 66, 71, 37, 13, 14, 8, 25, 53, 21, 68, 7, 67, 55, 27, 22, 1, 44, 46, 28, 48, 19, 73, 23, 16 y 3.
En el conjunto 2, se usaron los genes 60, 61, 23, 17, 10, 31, 16, 8, 72, 73, 18, 49, 71, 46, 29, 21, 66, 39, 22, 27, 43,
30, 51, 3, 38, 19, 37, 35, 70, 54, 40, 2, 55, 28, 45, 33, 25, 14, 48, 20, 36, 47, 62, 9, 69, 68, 53, 58, 15 y 7. En el
conjunto 3, se usaron los genes 53, 68, 31, 2, 62, 17, 49, 71, 6, 56, 3, 66, 23, 21 ,33, 30, 45, 73, 74, 11, 58, 27, 64,
18, 72, 42, 7, 28, 34, 43, 38, 65, 12, 47, 16, 40, 41, 36, 54, 61, 19, 63, 25, 46, 59, 9, 39, 55, 22 y 48. En el conjunto 4,
se usaron los genes 23, 70, 48, 1, 11, 25, 60, 26, 5, 58, 46, 39, 28, 71, 35, 34, 2, 59, 69, 55, 49, 40, 15, 14, 68, 57, 10, 31, 67, 74, 62, 44, 16,12, 64, 63, 61,13, 52,45,19, 50, 36, 33, 9, 24, 32, 29, 56 y 72. En el conjunto 5, se usaron los genes 30, 26, 10, 34, 67, 73, 15, 59, 3, 64, 14, 70, 23, 47, 72, 71, 44, 49, 31, 48, 5, 61, 53, 20, 33, 58, 37, 50, 43, 18, 21, 38, 29, 16, 12, 63, 39, 4, 45, 60, 69, 25, 24, 65, 55, 13, 36, 11, 17 y 22. En el conjunto 6, se usaron los genes
43, 34, 61, 19, 35, 56, 24, 3, 23, 15, 13, 69, 1, 67, 42, 41, 64, 25, 63, 28, 8, 53, 38, 71, 6, 36, 68, 14, 18, 65, 51, 33,
4, 60, 5, 22, 40, 30, 50, 37, 29, 17, 27, 11, 9, 66, 62, 57, 59 y 10. En el conjunto 7, se usaron los genes 51, 55, 46,
31, 21, 72, 8, 67, 56, 1, 64, 6, 63, 32, 20, 16, 25, 61, 2, 45, 35, 22, 66, 38, 36, 3, 34, 27, 74, 47, 54, 30, 14, 13, 37,
23, 19, 12, 59, 18, 52, 5, 17, 33, 7, 39, 43, 58, 41 y 10. En el conjunto 8, se usaron los genes 28, 68, 71, 46, 48, 47,
5, 23, 22, 35, 60, 3, 40, 33, 41, 72, 12, 24, 15, 37, 1, 20, 45, 53, 61, 65, 74, 4, 10, 51, 26, 30, 38, 44, 55, 73, 66, 6,
39, 52, 36, 2, 59, 67, 27, 43, 50, 18, 8 y 69. En el conjunto 9, se usaron los genes 73, 51, 67, 63, 24, 55, 42, 61, 13,
29, 23, 64, 49, 53, 19, 2, 43, 11, 15, 31, 58, 40, 38, 46, 44, 4, 27, 41, 28, 69, 8, 26, 5, 68, 37, 70, 25, 62, 22, 52, 1,
57, 54, 34, 16, 71, 9, 65, 14 y 30. En el conjunto 10, se usaron los genes 9, 13, 46, 2, 62, 47, 50, 36, 58, 23, 55, 31,
6, 40, 32, 27, 35, 33, 39, 1, 22, 19, 65, 16, 52, 72, 30, 3, 12, 7, 74, 21, 54, 20, 41, 10, 28, 37, 24, 53, 69, 11, 14, 67,
25, 71, 15, 42, 18 y 73.
5
10
15
20
25
30
35
40
45
50
55
60
65
Para 55 genes, conjunto 1, se usaron los genes 19, 3, 26, 44, 16, 59, 11, 39, 46, 54, 22, 7, 60, 30, 72, 6, 74, 53, 57, 14, 43, 47, 27, 45, 37, 24, 33, 64, 21, 36, 20, 50, 68, 62, 63, 17, 61, 10, 70, 18, 25, 71, 29, 65, 51, 56, 58, 69, 5, 55, 12, 1, 40, 49 y 13. En el conjunto 2, se usaron los genes 35, 15, 11, 33, 5, 29, 73, 69, 31, 70, 10, 45, 41, 72, 74, 26,
32, 12, 30, 34, 16, 64, 13, 50, 46, 38, 18, 48, 37, 68, 40, 61, 62, 6, 63, 47, 36, 65, 17, 67, 71, 39, 4, 59, 22, 24, 8, 9,
58, 3, 52, 20, 14, 25 y 7. En el conjunto 3, se usaron los genes 7, 19, 50, 62, 47, 74, 22, 26, 37, 8, 41, 53, 52, 67, 16,
40, 54, 34, 30, 46, 25, 55, 31, 3, 69, 38, 29, 65, 45, 43, 51, 68, 18, 57, 21, 5, 32, 20, 27, 73, 66, 10, 49, 24, 12, 13,
11, 71, 60, 23, 63, 35, 48, 39 y 70. En el conjunto 4, se usaron los genes 58, 70, 43, 68, 39, 57, 71, 27, 21, 53, 16,
23, 25, 60, 40, 36, 2, 63, 33, 49, 5, 54, 32, 66, 50, 59, 14, 52, 15, 48, 45, 44, 19, 72, 26, 10, 6, 41, 34, 61, 42, 67, 17,
24, 8, 11, 29, 74, 3, 51, 47, 65, 69, 28 y 1. En el conjunto 5, se usaron los genes 60, 53, 21, 63, 7, 19, 69, 3, 9, 22,
10, 50, 59, 71, 20, 11, 70, 6, 4, 17, 58, 16, 40, 68, 73, 38, 18, 15, 57, 26, 34, 67, 41, 27, 49, 28, 46, 54, 1, 13, 31, 48,
32, 61, 42, 66, 29, 5, 55, 72,25, 30, 39, 44 y 56. En el conjunto 6, se usaron los genes 4, 36, 17, 47, 16, 6, 14, 51, 65,
42, 31, 38, 26, 15, 70, 28, 41, 72, 30, 3, 29, 55, 34, 32, 54, 24, 48, 39, 22, 57, 37,23, 71, 61, 50, 21, 27, 53, 25, 40,
20, 69, 58, 66, 46, 1, 43, 12, 33, 63, 18, 68, 10, 56 y 45. En el conjunto 7, se usaron los genes 71, 7, 38, 61, 22, 33,
51, 25, 68, 6, 1, 49, 9, 58, 18, 55, 5, 50, 65, 52, 26, 59, 35, 11, 15, 70, 54, 27, 60, 28, 19, 63, 21, 10, 32, 42, 73, 36, 45, 66, 47, 2, 56, 23, 64, 44, 34, 29, 48, 69, 37, 16, 74, 53 y 43. En el conjunto 8, se usaron los genes 25, 42, 70, 28,
6, 48, 43, 20, 60, 18, 56, 74, 27, 9, 55, 67, 58, 68, 39, 38, 29, 1, 21, 45, 44, 66, 53, 34, 47, 64, 41, 57, 10, 3, 31, 65,
54, 46, 50, 59, 23, 73, 24, 51, 36, 26, 16, 49, 37, 62, 7, 32, 19, 22 y 14. En el conjunto 9, se usaron los genes 49,
65,20, 59, 21, 45, 54, 29, 51, 50, 17, 37, 55, 47, 57, 9, 8, 18, 11, 10, 25, 1, 30, 68, 5, 6, 74, 70, 60, 53, 48, 39, 4, 23,
27, 73, 35, 40, 41, 44, 24, 3, 58, 19, 14, 13, 33, 63, 62, 46, 2, 12, 72, 36 y 7. En el conjunto 10, se usaron los genes
73, 53, 26, 24, 58, 25, 59, 71, 34, 65, 46, 2, 57, 48, 68, 21, 44, 22, 16, 70, 60, 8, 66, 45, 14, 27, 43, 37, 20, 36, 72,
18, 56, 4, 7, 6, 23, 15, 74, 1, 9, 50, 5, 35, 40, 32, 12, 38, 69, 33, 61, 62, 10, 47 y 39.
Para 60 genes, conjunto 1, se usaron los genes 49, 60, 66, 26, 22, 53, 33, 56, 10, 44, 17, 36, 41, 6, 21, 57, 39, 65,
24, 30, 31, 15, 43, 68, 64, 59, 28, 73, 13, 18, 51, 34, 63, 40, 71, 58, 48, 11, 37, 42, 70, 45, 72, 3, 67, 35, 52, 46, 32,
55, 27, 38, 19, 25, 5, 69, 62, 14, 23 y 4. En el conjunto 2, se usaron los genes 57, 5, 31, 15, 20, 54, 21, 42, 71, 50,
17, 68, 61, 53, 9, 35, 67, 12, 14, 52, 41, 38, 22, 45, 32, 39, 70, 18, 6, 26, 59, 40, 25, 28, 56, 10, 3, 47, 34, 8, 60, 2, 9,
62, 66, 19, 11, 37, 27, 36, 69, 7, 65, 4, 33, 24, 51, 55, 48 y 44. En el conjunto 3, se usaron los genes 37, 54, 44, 66, 36, 1, 61, 62, 47, 69, 4, 30, 31, 11, 8, 63, 38, 16, 65, 25, 74, 21, 34, 60, 20, 71, 12, 19, 43, 15, 27, 57, 6, 55, 64, 22, 14, 39, 53, 23, 17, 28, 51, 56, 40, 29, 58, 48, 42, 59, 68, 5, 35, 50, 72, 10, 45, 32, 33 y 73. En el conjunto 4, se
usaron los genes 24, 2, 49, 57, 35, 45, 40, 51, 42, 7, 47, 5, 8, 17, 61, 74, 64, 72, 50, 60, 70, 26, 9, 56, 32, 4, 16, 44,
27, 43, 53, 33, 46, 55, 41, 68, 48, 11, 10, 39, 19, 6, 3, 14, 65, 69, 30, 34, 29, 36, 58, 28, 1,23, 73, 15, 25, 13, 54 y 18. En el conjunto 5, se usaron los genes 18, 28, 1,22, 71, 37, 62, 46, 31, 25, 70, 64, 66, 35, 5, 60, 10, 26, 9, 43, 67, 20,
59, 51, 33, 42, 3, 24, 49, 13, 27, 38, 61, 14, 52, 63, 11, 74, 7, 16, 23, 72, 39, 73, 15, 6, 17, 30, 57, 8, 50, 48, 34, 53,
2, 69, 29, 56, 44 y 47. En el conjunto 6, se usaron los genes 33, 74, 12, 7, 49, 25, 38, 1, 8, 4, 48, 26, 58, 54, 21, 50, 72, 45, 62, 66, 36, 13, 42, 5, 39, 17, 28, 23, 67, 41, 29, 73, 19, 56, 51, 69, 10, 16, 55, 14, 24, 64, 22, 59, 52, 35, 2, 31, 3, 9, 27, 71, 30, 32, 53, 11, 40, 61, 15 y 70. En el conjunto 7, se usaron los genes 30, 65, 26, 48, 47, 20, 17, 56, 35, 32, 10, 11, 1, 59, 50, 53, 45, 13, 63, 49, 41, 74, 16, 57, 15, 64, 12, 54, 5, 8, 67, 69, 31, 14, 61, 60, 37, 66, 43, 71, 23, 36, 51, 44, 34, 2, 42, 19, 58, 25, 27, 68, 18, 52, 21, 7, 70, 22, 28 y 62. En el conjunto 8, se usaron los genes 12,
58, 11, 5, 72, 70, 63, 66, 49, 44, 14, 48, 26, 73, 51, 47, 13, 65, 1, 39, 61, 17, 40, 8, 24, 54, 42, 34, 64, 21, 53, 59, 46,
4, 20, 29, 57, 74, 31, 67, 6, 69, 7, 68, 41, 3, 18, 62, 19, 32, 10, 43, 36, 71, 28, 60, 30, 15, 23 y 52. En el conjunto 9, se usaron los genes 7, 20, 69, 12, 58, 40, 70, 57, 3, 37, 6, 16, 61, 11, 13, 31, 55, 17, 49, 22, 36, 47, 44, 18, 45, 68,
25, 72, 19, 14, 39, 46, 30, 59, 56, 5, 66, 2, 41, 51, 9, 54, 35, 15, 26, 27, 23, 65, 4, 63, 1, 60, 21, 74, 24, 43, 38, 64, 50
y 67. En el conjunto 10, se usaron los genes 5, 43, 54, 22, 49, 48, 25, 24, 52, 35, 14, 70, 26, 72, 59, 71, 9, 41, 74, 36,
17, 47, 29, 34, 20, 27, 65, 68, 3, 73, 45, 62, 57, 56, 53, 44, 6, 7, 31, 55, 30, 23, 15, 33, 38, 42, 10, 60, 66, 8, 1, 64,
19, 16, 12, 61, 63, 51, 18 y 2.
Para 65 genes, conjunto 1, se usaron los genes 11, 10, 1, 69, 43, 33, 54, 24, 39, 27, 42, 18, 9, 46, 12, 20, 61, 44, 51, 64, 35, 8, 36, 38, 21, 7, 57, 59, 23, 49, 17, 15, 22, 55, 29, 16, 37, 72, 30, 31, 45, 63, 40, 28, 41, 32, 66, 65, 5, 47, 53,
60, 25, 50, 74, 52, 14, 68, 48, 13, 2, 4, 3, 6 y 67. En el conjunto 2, se usaron los genes 37, 8, 31, 4, 23, 57, 69, 40, 3,
9, 5, 32, 42, 44, 56, 21, 10, 34, 74, 61, 39, 38, 13, 70, 41, 19, 48, 47, 29, 52, 26, 72, 49, 45, 7, 63, 16, 25, 24, 14, 18, 60, 59, 11, 35, 2, 30, 68, 58, 67, 27, 33, 66, 12, 71, 51, 55, 6, 20, 54, 1, 46, 64, 62 y 53. En el conjunto 3, se usaron los genes 24, 19, 35, 57, 27, 8, 23, 30, 65, 32, 59, 29, 4, 47, 17, 53, 34, 54, 73, 14, 20, 63, 43, 3, 38, 61, 31, 49, 25, 42, 41, 51, 18, 7, 40, 39, 33, 50, 70, 28, 13, 74, 36, 45, 64, 5, 16, 58, 1, 66, 62, 46, 15, 12, 72, 21, 2, 68, 71, 9, 44,
26, 37, 6 y 55. En el conjunto 4, se usaron los genes 62, 29, 5, 41, 18, 4, 21, 63, 65, 8, 55, 61, 66, 34, 23, 28, 14, 49,
68, 15, 1, 11, 19, 73, 13, 57, 20, 27, 50, 2, 72, 22, 6, 7, 40, 67, 51, 45, 10, 36, 53, 64, 54, 24, 25, 37, 74, 12, 52, 26,
38, 32, 3, 30, 33, 39, 48, 58, 17, 42, 71, 43, 69, 56 y 9. En el conjunto 5, se usaron los genes 49, 58, 74, 65, 67, 44,
57, 28, 56, 18, 59, 31, 10, 17, 41, 39, 63, 7, 21, 55, 38, 2, 51, 42, 5, 53, 20, 34, 16, 43, 19, 15, 50, 4, 6, 11, 52, 37, 8, 64, 69, 12, 48, 60, 1, 66, 27, 36, 45, 30, 14, 72, 68, 73, 35, 47, 71, 22, 70, 33, 32, 46, 25, 13 y 54. En el conjunto 6, se usaron los genes 7, 44, 23, 68, 46, 30, 10, 4, 3, 53, 22, 38, 50, 26, 55, 49, 20, 11, 73, 12, 62, 63, 43, 69, 6, 61, 52,
25, 65, 16, 47, 34, 33, 28, 42, 58, 29, 39, 31, 1, 36, 13, 5, 60, 35, 19, 40, 18, 59, 64, 41, 70, 72, 57, 67, 9, 74, 8, 14,
71, 45, 56, 32, 51 y 2. En el conjunto 7, se usaron los genes 57, 61, 9, 48, 31, 4, 40, 35, 1, 16, 44, 67, 68, 34, 6, 64,
7, 54, 53, 10, 18, 39, 23, 14, 33, 74, 51, 38, 24, 19, 72, 63, 36, 65, 32, 2, 27, 45, 3, 43, 21, 49, 30, 60, 50, 70, 41, 20,
11, 37, 13, 15, 5, 12, 46, 26, 22, 71, 8, 62, 29, 28, 25, 17 y 52. En el conjunto 8, se usaron los genes 11,21, 3, 6, 74,
58, 52, 40, 17, 23, 41, 63, 22, 56, 55, 8, 60, 54, 51, 57, 66, 68, 29, 24, 69, 39, 16, 49, 72, 59, 48, 61, 2, 7, 44, 37, 43,
45, 35, 25, 1, 4, 20, 14, 36, 42, 65, 62, 71, 32, 19, 70, 28, 27, 9, 46, 33, 18, 67, 15, 30, 26, 12, 47 y 53. En el conjunto
9, se usaron los genes 48, 27, 64, 55, 30, 2, 33, 16, 31, 21, 57, 50, 63, 17, 44, 29, 4, 6, 60, 65, 23, 19, 58, 68, 25, 59,
5
10
15
20
25
30
35
40
45
50
55
60
65
14, 7, 42, 12, 69, 45, 53, 73, 56, 34, 41, 3, 18, 5, 72, 70, 40, 37, 62, 43, 51, 24, 52, 20, 39, 8, 13, 26, 10, 66, 54, 22,
49, 61, 11, 46, 32, 67 y 36. En el conjunto 10, se usaron los genes 31, 39, 50, 60, 17, 33, 73, 30, 3, 27, 10, 62, 29,
12, 59, 1, 34, 69, 51, 72, 65, 52, 16, 36, 28, 23, 42, 40, 66, 58, 48, 46, 38, 74, 20, 55, 21, 49, 63, 2, 70, 7, 26, 53, 41,
45, 25, 44, 71, 32, 24, 13, 14, 6, 57, 11, 68, 35, 54, 22, 64, 8, 9, 56 y 37.
Para 70 genes, conjunto 1, se usaron los genes 72, 74, 31, 73, 52, 16, 32, 24, 14, 66, 59, 28, 54, 1, 11, 12, 34, 57, 5, 67, 25, 42, 62, 71, 68, 69, 48, 7, 18, 20, 47, 19, 53, 2, 4, 15, 26, 63, 37, 17, 10, 60, 65, 8, 22, 70, 36, 30, 41, 9, 21,
35, 49, 38, 33, 56, 46, 27, 45, 44, 39, 43, 29, 50, 61, 40, 23, 64, 55 y 3. En el conjunto 2, se usaron los genes 45, 32,
60, 2, 42, 56, 8, 46, 30, 27, 17, 62, 26, 24, 65, 49, 16, 70, 3, 47, 50, 4, 40, 28, 1, 36, 22, 59, 48, 9, 57, 5, 72, 23, 13, 44, 67, 14, 12, 34, 21, 41, 71, 39, 66, 25, 69, 19, 15, 6, 68, 29, 52, 43, 64, 58, 54, 11, 37, 38, 55, 7, 20, 61, 53, 63, 10, 74, 51 y 35. En el conjunto 3, se usaron los genes 66, 71, 40, 62, 60, 51, 61, 5, 19, 15, 34, 13, 18, 8, 28, 59, 35,
54, 2, 55, 29, 22, 41, 37, 45, 64, 48, 7, 73, 27, 30, 69, 63, 23, 25, 42, 1, 24, 14, 38, 4, 70, 53, 3, 36, 12, 74, 68, 26,
57, 33, 17, 67, 72, 52, 58, 46, 39, 43, 56, 65, 10, 44, 11, 20, 47, 50, 9, 21 y 49. En el conjunto 4, se usaron los genes 73, 26, 33, 40, 71, 50, 62, 59, 10, 39, 64, 68, 3, 1, 44, 9, 72, 57, 43, 37, 24, 65, 48, 6, 11, 23, 36, 19, 7, 31, 67, 69,
38, 29, 16, 35, 63, 21, 46, 15, 47, 28, 2, 5, 52, 70, 14, 22, 56, 45, 17, 4, 25, 66, 13, 55, 20, 30, 32, 54, 51, 49, 58, 74,
42, 53, 61, 34, 12 y 60. En el conjunto 5, se usaron los genes 7, 1, 24, 70, 26, 35, 68, 71, 74, 33, 5, 20, 49, 27, 65,
10, 72, 21, 66, 12, 4, 43, 9, 55, 23, 56, 47, 31, 42, 59, 61, 45, 67, 13, 63, 58, 17, 54, 28, 3, 64, 53, 39, 36, 30, 40, 37,
16, 41, 11, 52, 14, 62, 8, 46, 25, 44, 69, 29, 48, 51, 22, 73, 57, 18, 15, 19, 38, 6 y 50. En el conjunto 6, se usaron los
genes 41, 36, 1, 27, 9, 51, 4, 38, 8, 25, 73, 5, 7, 22, 68, 30, 6, 33, 65, 70, 21, 26, 60, 62, 63, 54, 57, 74, 58, 44, 11,
31, 53, 34, 10, 48, 23, 3, 42, 35, 49, 13, 71, 17, 50, 28, 19, 20, 40, 64, 56, 43, 69, 59, 39, 66, 72, 46, 32, 2, 14, 47,
52, 45, 15, 37, 12, 16, 24 y 67. En el conjunto 7, se usaron los genes 39, 70, 16, 5, 43, 6, 36, 30, 9, 53, 2, 34, 72, 42,
64, 73, 56, 63, 38, 13, 19, 27, 29, 60, 37, 52, 1, 3, 21, 22, 68, 69, 26, 55, 61, 11, 18, 12, 45, 8, 51, 65, 32, 33, 67, 48,
50, 10, 20, 28, 58, 7, 49, 35, 57, 71, 23, 17, 24, 62, 59, 54, 15, 40, 14, 41, 47, 46, 44 y 4. En el conjunto 8, se usaron
los genes 3, 5, 50, 35, 53, 57, 14, 49, 55, 8, 25, 22, 71, 60, 13, 19, 12, 32, 26, 44, 15, 39, 17, 31, 61, 23, 66, 68, 4, 6,
7, 41, 24, 40, 58, 67, 46, 70, 45, 64, S1, 69, 18, 62, 47, 52, 11, 30, 73, 28, 33, 2, 36, 1, 72, 42, 20, 27, 10, 16, 63, 38,
59, 74, 43, 9, 56, 34, 21 y 65. En el conjunto 9, se usaron los genes 18, 49, 70, 46, 29, 9, 52, 53, 64, 28, 37, 27, 7,
57, 44, 19, 72, 61, 67, 30, 62, 47, 2, 39, 8, 65, 26, 14, 63, 4, 20, 59, 45, 15, 10, 3, 16, 58, 25, 38, 60, 71, 66, 32, 23,
55, 69, 12, 33, 6, 42, 36, 22, 48, 24, 68, 41, 17, 54, 13, 21, 51, 73, 74, 40, 43, 1, 11, 56 y 35. En el conjunto 10, se usaron los genes 14, 12, 65, 74, 58, 6, 36, 5, 34, 11, 18, 33, 32, 7, 22, 37, 64, 59, 9, 52, 41, 26, 3, 19, 48, 35, 56, 62, 42, 60, 1, 8, 43, 50, 25, 61, 54, 49, 20, 70, 44, 30, 15, 46, 72, 38, 4, 29, 68, 21, 39, 17, 16, 53, 45, 73, 63, 31, 55, 47, 24, 69, 2, 71, 13, 28, 66, 23, 57 y 40.
Se realizó un experimento similar con subconjuntos aleatorios de 50 a todos los miembros del conjunto de 90 secuencias génicas expresadas. De nuevo, se usaron los niveles de expresión de combinaciones aleatorias de 50, 55, 60, 65, 70 y las 90 (cada combinación muestreada 10 veces) de las 90 secuencias expresadas con datos de tipos tumorales y después se usaron para predecir conjuntos aleatorios de ensayo de muestras tumorales (cada una muestreada 10 veces) que variaban de 2 a los 39 tipos. Los datos resultantes se muestran en las Figuras 6 y 7.
Los miembros de las 90 secuencias génicas se catalogaron de 1 a 90 y los conjuntos aleatorios representativos usados en la invención son los siguientes:
Para el conjunto 1 de 50-genes, se usaron los genes 89, 30, 62, 23, 31, 20, 53, 25, 15, 38, 11, 22, 68, 44, 58, 7, 14,
61, 67, 32, 18, 71, 9, 54, 46, 3, 57, 50, 59, 79, 48, 90, 82, 64, 39, 21, 60, 37, 47, 10, 52, 77, 33, 45, 35, 83, 16, 69, 74
y 27. En el conjunto 2, se usaron los genes 25, 17, 64, 82, 23, 5, 77, 48, 72, 63, 34, 60, 61, 35, 58, 19, 56, 83, 8, 13,
38, 89, 59, 62, 88, 71, 11, 29, 31, 68, 65, 67, 78, 44, 27, 81, 24, 1, 18, 55, 85, 46, 41, 14, 84, 26, 16, 21, 12 y 69. En
el conjunto 3, se usaron los genes 24, 39, 35, 15, 49, 44, 28, 58, 20, 3, 88, 23, 54, 31, 33, 37, 62, 25, 87, 75, 17, 41,
21, 19, 38, 85, 86, 74, 8, 12, 77, 30, 27, 43, 76, 73, 9, 14, 6, 63, 64, 81, 26, 66, 2, 56, 34, 60, 57 y 61. En el conjunto
4, se usaron los genes 40, 71, 55, 63, 2, 13, 38, 58, 26, 18, 76, 74, 17, 67, 69, 4, 9, 20, 21, 10, 35, 70, 49, 37, 12, 77, 61, 60, 15, 7, 36, 89, 33, 59, 78, 39, 82, 16, 64, 28, 6, 66, 52, 5, 44, 73, 34, 75, 31 y 29. En el conjunto 5, se usaron
los genes 16, 37, 57, 18, 29, 66, 54, 6, 44, 70, 20, 65, 5, 61, 72, 83, 85, 58, 87, 73, 23, 76, 25, 68, 49, 24, 79, 89, 55,
75, 47, 19, 33, 39, 21, 63, 84, 32, 77, 40, 12, 11, 42, 50, 1, 9, 78, 3, 74 y 7. En el conjunto 6, se usaron los genes 42,
29, 74, 68, 27, 54, 15, 63, 30, 51, 78, 56, 82, 66, 80, 79, 90, 64, 22, 44, 71, 2, 89, 39, 46, 52, 36, 32, 84, 6, 59, 9, 38,
4, 55, 19, 7, 60, 49, 23, 73, 5, 11, 50, 70, 34, 61, 81, 67 y 28. En el conjunto 7, se usaron los genes 31, 27, 24, 75, 7,
46, 40, 60, 51, 37, 87, 28, 67, 62, 50, 66, 61, 63, 49, 1, 39, 74, 81, 4, 52, 22, 79, 45, 12, 41, 15, 90, 26, 33, 78, 48,
83, 10, 53, 73, 6, 19, 71, 59, 68, 56, 64, 13, 32 y 30. En el conjunto 8, se usaron los genes 88, 57, 5, 4, 1, 43, 12, 32,
66, 81, 90, 19, 51, 18, 55, 9, 29, 75, 11, 73, 23, 61, 6, 79, 69, 60, 13, 62, 8, 71, 2, 52, 67, 59, 87, 33, 80, 21, 14, 89,
39, 65, 56, 38, 47, 31, 84, 25,45 y 41. En el conjunto 9, se usaron los genes 60, 45, 51, 32, 49, 2, 44, 66, 83, 50, 87,
1, 90, 28, 42, 85, 13, 40, 70, 82, 79, 89, 64, 63, 27, 52, 10, 86, 77, 15, 56, 8, 33, 53, 38, 46, 67, 19, 68, 29, 48, 21,
34, 61, 18, 55, 25, 35, 39 y 80. En el conjunto 10, se usaron los genes 80, 39, 23, 76, 87, 33, 30, 88, 85, 89, 24, 47,
44, 43, 48, 55, 14, 73, 22, 19, 67, 1, 42, 51, 60, 12, 9, 6, 75, 17, 40, 25, 28, 74, 38, 66, 5, 50, 8, 37, 15, 29, 21, 11,
35, 31, 13, 36, 52 y 18.
Para el conjunto 1 de 55 genes, se usaron los genes 86, 47, 80, 15, 74, 20, 79, 35, 14, 49, 41, 2, 48, 30, 81, 65, 5,
24, 51, 10, 31, 68, 7, 21, 28, 37, 38, 4, 18, 23, 44, 77, 42, 19, 61, 27, 75, 67, 36, 22, 26, 50, 32, 58, 71, 57, 76, 1, 66,
72, 33, 6, 34, 59 y 13. En el conjunto 2, se usaron los genes 73, 88, 39, 52, 87, 78, 84, 1, 42, 69, 62, 58, 10, 51, 38,
14, 77, 49, 36, 35, 34, 15, 65, 60, 20, 17, 61, 2, 59, 22, 81, 11, 19, 41, 5, 29, 12, 43, 7, 4, 64, 40, 74, 48, 72, 54, 68,
5
10
15
20
25
30
35
40
45
50
55
60
65
86, 66, 6, 67, 89, 21, 16 y 9. En el conjunto 3, se usaron los genes 28, 89, 35, 86, 49, 56, 69, 18, 15, 27, 13, 6, 51,
77, 8, 80, 16, 78, 43, 29, 37, 20, 9, 31, 32, 67, 48, 65, 82, 62, 76, 25, 54, 41, 90, 47, 2, 71, 87, 84, 57, 74, 61, 59, 85,
75, 10, 66, 46, 73, 24, 44, 14, 4 y 7. En el conjunto 4, se usaron los genes 48, 76, 17, 62, 65, 87, 19, 24, 83, 29, 55,
12, 68, 82, 73, 18, 20, 10, 81, 53, 33, 56, 34, 5, 60, 46, 16, 25, 2, 42, 6, 49, 4, 45, 88, 32, 77, 8, 1, 71, 3, 27, 72, 59,
79, 64, 11, 80, 57, 61, 75, 39, 23, 52 y 37. En el conjunto 5, se usaron los genes 54, 77, 74, 76, 81, 17, 25, 57, 29,
36, 55, 75, 66, 15, 2, 41, 37, 59, 12, 45, 4, 9, 69, 18, 49, 22, 42, 62, 10, 52, 48, 31, 44, 19, 79, 50, 40, 32, 89, 87, 11,
5, 73, 20, 80, 35, 70, 53, 83, 72, 88, 47, 84, 39 y 65. En el conjunto 6, se usaron los genes 86, 43, 75, 90, 32, 85, 38, 54, 87, 42, 73, 55, 27, 34, 11, 14, 65, 82, 77, 21, 26, 46, 83, 10, 15, 22, 66, 20, 67, 72, 35, 68, 3, 53, 44, 50, 70, 40,
30, 31, 84, 81, 62, 51, 80, 79, 59, 57, 88, 69, 2, 64, 23, 28 y 16. En el conjunto 7, se usaron los genes 76, 15, 53, 8,
89, 52, 20, 3, 47, 83, 45, 31, 80, 82, 4, 57, 65, 41, 29, 77, 46, 60, 24, 33, 70, 37, 12, 66,42, 61, 63, 86, 30, 11, 40, 27,
39, 56, 9, 49, 35, 22, 10, 48, 18, 68, 58, 62, 34, 85, 84, 26, 43, 81 y 38. En el conjunto 8, se usaron los genes 3, 46,
11, 89, 63, 61, 26, 69, 47, 82, 27, 39, 52, 2, 70, 6, 41, 14, 36, 30, 65, 74, 28, 34, 42, 79, 59, 4, 72, 37, 66, 50, 45, 23, 73, 71, 10, 19, 78, 62, 20, 5, 56, 25, 75, 38, 13, 86, 88, 22, 32, 58, 60, 1 y 51. En el conjunto 9, se usaron los genes 16, 61, 85, 3, 42, 24, 55, 4, 9, 22, 28, 31, 53, 74, 25, 52, 10, 49, 2, 21, 30, 78, 54, 26, 38, 87, 35, 37, 45, 84, 83, 57,
64, 65, 68, 50, 1, 34, 75, 67, 60, 5, 7, 58, 59, 76, 27, 77, 44, 32, 6, 11, 48, 56 y 15. En el conjunto 10, se usaron los
genes 72, 86, 46, 5, 3, 29, 54, 66, 20, 44, 41, 47, 14, 65, 83, 56, 43, 26, 49, 48, 69, 24, 45, 27, 73, 11, 40, 22, 78, 2,
39, 15, 31, 35, 77, 61, 9, 52, 37, 1, 89, 79, 60, 18, 50, 17, 88, 80, 57, 71, 12, 53, 36, 58 y 42.
Para el conjunto 1 de 60 genes, se usaron los genes 75, 54, 79, 78, 4, 48, 36, 29, 28, 32, 82, 38, 21, 8, 80, 46, 47,
57, 76, 50, 18, 68, 85, 13, 61, 65, 71, 56, 45, 58, 84, 25, 72, 43, 7, 77, 74, 69, 86, 31, 19, 63, 35, 83, 70, 3, 62, 90,
52, 87, 44, 41, 66, 12, 23, 59, 1, 10,49 y 67. En el conjunto 2, se usaron los genes 6, 50, 10, 38, 29, 59, 60, 12, 74,
14, 65, 61, 54, 2, 89, 68, 9, 62, 20, 81, 70, 67, 66, 52, 45, 58, 43, 31, 86, 79, 82, 1, 42, 88, 85, 22, 87, 84, 24, 21, 5,
39, 25, 51, 40, 63, 49, 7, 35, 36, 71, 90, 47, 15, 56, 23, 83, 34, 76 y 19. En el conjunto 3, se usaron los genes 17, 68,
41, 53, 15, 58, 90, 21, 10, 61, 72, 44, 22, 8, 32, 47, 55, 48, 45, 3, 5, 7, 1, 4, 24, 49, 75, 54, 39, 57, 19, 70, 79, 66, 6,
60, 51, 56, 46, 14, 85, 80, 36, 31, 37, 86, 42, 84, 87, 23, 2, 81, 11, 50, 40, 52, 13, 65, 62 y 76. En el conjunto 4, se
usaron los genes 54, 24, 50, 11, 77, 63, 84, 71, 16, 51, 78, 83, 10, 28, 31, 29, 43, 14, 30, 61, 81, 58, 4, 48, 64, 37,
18, 39, 1, 67, 45, 40, 80, 79, 8, 55, 36, 2, 32, 25, 21, 46, 73, 38, 34, 52, 49, 65, 13, 66, 6, 76, 20, 85, 15, 44, 60, 69,
86 y 88. En el conjunto 5, se usaron los genes 89, 22, 12, 82, 28, 14, 87, 8, 79, 48, 69, 84, 66, 43, 88, 13, 9, 50, 75, 71, 20, 36, 5, 54, 80, 62, 4, 23, 24, 60, 19, 10, 63, 81, 68, 30, 32, 52, 56, 37, 15, 83, 16, 90, 26, 44, 78, 39, 61, 59,
45, 74, 58, 86, 35, 33, 47, 57, 18 y 42. En el conjunto 6, se usaron los genes 41, 38, 76, 54, 12, 29, 66, 35, 68, 80,
64, 57, 46, 25, 27, 49, 86, 36, 20, 5, 16, 19, 69, 59, 48, 4, 10, 70, 17, 60, 50, 63, 18, 33, 65, 39, 23, 82, 51, 55, 8, 28,
53, 84, 67, 22, 71, 77, 13, 9, 42, 21, 62, 31, 78, 11, 89, 45, 52 y 74. En el conjunto 7, se usaron los genes 84, 12, 17,
10, 33, 56, 50, 61, 74, 21, 78, 11, 37, 36, 3, 5, 30, 43, 47, 54, 27, 32, 77, 51, 42, 4, 76, 71, 83, 46, 57, 73, 87, 24, 90, 8, 72, 29, 35, 66, 28, 70, 22, 39, 65, 85, 1, 82, 40, 89, 80, 58, 52, 38, 59, 86, 69, 13, 16 y 14. En el conjunto 8, se usaron los genes 71, 3, 44, 6, 16, 69, 34, 20, 56, 72, 5, 68, 9, 52, 49, 58, 79, 76, 2, 59, 7, 73, 51, 74, 19, 88, 60, 30,
61, 13, 89, 50, 31, 40, 81, 10, 21, 54, 45, 77, 67, 36, 46, 1, 43, 83, 55, 12, 80, 28, 41, 86, 47, 39, 53, 17, 78, 63, 87 y
48. En el conjunto 9, se usaron los genes 47, 30, 10, 11, 39, 23, 41, 29, 21, 36, 45, 49, 69, 1, 24, 66, 57, 12, 56, 22,
71, 9, 89, 52, 83, 28, 80, 37, 72, 67, 76, 87, 82, 5, 88, 4, 3, 68, 58, 64, 62, 46, 74, 7, 20, 15, 48, 53, 54, 63, 19, 13,
43, 32, 51, 31, 33, 27, 35 y 40. En el conjunto 10, se usaron los genes 75, 29, 27, 66, 15, 47, 14, 3, 12, 80, 31, 32,
41, 17, 74, 7, 57, 59, 64, 25, 13, 77, 33, 43, 81, 55, 48, 68, 30, 54, 69, 88, 62, 86, 67, 37, 20, 8, 42, 19, 70, 24, 49,
73, 23, 10, 1, 85, 89, 44, 58, 2, 11, 63, 76, 5, 53, 83, 50 y 9.
Para el conjunto 1 de 65 genes se usaron los genes 55, 36, 14, 26, 67, 60, 28, 31, 46, 85, 16, 10, 17, 45, 73, 87, 7,
72, 90, 4, 84, 34, 78, 19, 71, 54, 29, 43, 76, 12, 35, 61, 49, 57, 89, 20, 50, 47, 86, 88, 59, 75, 15, 8, 5, 3, 32, 81, 74,
23, 41, 13, 33, 63, 77, 22, 9, 38, 64, 69, 80, 25, 1, 18 y 30. En el conjunto 2, se usaron los genes 32, 81, 5, 65, 79,
12, 52, 83, 2, 39, 19, 37, 44, 66, 63, 72, 56, 60, 3, 22, 70, 64, 9, 67, 15, 8, 50, 48, 71, 82, 76, 14, 28, 18, 25, 11, 29,
58, 35, 31, 10, 69, 38, 90, 80, 74, 53, 75, 4, 77, 89, 55, 57, 59, 51, 42, 41, 68, 23, 84, 45, 40, 20, 85 y 61. En el
conjunto 3, se usaron los genes 33, 52, 22, 67, 7, 36, 40, 6, 56, 29, 48, 41, 28, 68, 83, 90, 51, 70, 60, 24, 87, 88, 18,
58, 73, 1, 17, 8, 26, 89, 38, 4, 10, 47, 75, 72, 50, 13, 23, 66, 20, 30, 12, 43, 46, 15, 16, 5, 55, 31, 63, 32, 53, 69, 39,
71, 42, 62, 57, 34, 44, 14, 25, 64 y 80. En el conjunto 4, se usaron los genes 30, 45, 74, 3, 13, 63, 76, 27, 46, 11, 51,
2, 20, 78, 66, 65, 43, 7, 69, 40, 28, 19, 25, 52, 26, 34, 49, 44, 60, 59, 38, 48, 85, 87, 18, 82, 15, 42, 24, 67, 61, 71, 70, 35, 68, 79, 47, 83, 80, 84, 31, 32, 9, 77, 72, 62, 8, 55, 54, 1, 58, 16, 53, 89 y 90. En el conjunto 5, se usaron los genes 14, 55, 53, 45, 32, 63, 49, 15, 10, 11, 47, 52, 3, 13, 71, 68, 85, 34, 66, 64, 83, 78, 28, 21, 30, 54, 29, 88, 59,
73, 26, 84, 50, 77, 65, 82, 20, 86, 19, 57, 62, 25, 43, 27, 8, 6, 87, 38, 51, 61, 56, 2, 18, 46, 44, 80, 9, 31, 36, 76, 1, 7,
33, 48 y 58. En el conjunto 6, se usaron los genes 66, 44, 18, 85, 54, 28, 80, 65, 25, 1, 88, 72, 74, 46, 76, 71, 24, 51, 47, 31, 21, 60, 83, 32, 3, 63, 64, 69, 52, 27, 2, 38, 34, 10, 12, 35, 77, 33, 29, 56, 67, 40, 30, 22, 49, 5, 7, 43, 17, 13, 81, 20, 79, 14, 48, 73, 53, 90, 70, 59, 19, 16, 8, 36 y 23. En el conjunto 7, se usaron los genes 89, 37, 48, 32, 75, 46,
90, 2, 66, 44, 55, 17, 9, 59, 68, 83, 24, 53, 19, 67, 74, 35, 72, 4, 13, 76, 15, 62, 63, 28, 51, 26, 39, 20, 18, 45, 36, 78,
41, 84, 87, 11, 80, 12, 81, 3, 50, 86, 6, 61, 73, 31, 27, 88, 42, 71, 33, 43, 60, 30, 69, 34, 21, 49 y 70. En el conjunto 8,
se usaron los genes 84, 73, 14, 23, 36, 47, 31, 61, 57, 50, 78, 53, 90, 68, 37, 39, 75, 4, 10, 80, 35, 32, 85, 18, 81, 29, 66, 76, 54, 41, 62, 30, 58, 49, 33, 64, 45, 87, 25, 79, 20, 69, 42, 17, 88, 24, 2, 34, 16, 28, 86, 15, 7, 82, 1, 60, 11, 48,
89, 22, 77, 74, 72, 6 y 43. En el conjunto 9, se usaron los genes 1, 74, 39, 48, 44, 47, 3, 8, 80, 54, 16, 41, 76, 9, 85,
86, 49, 70, 52, 89, 19, 66, 43, 17, 15, 63, 29, 53, 42, 32, 30, 4, 36, 7, 77, 2, 84, 87, 28, 67, 20, 56, 65, 31, 12, 25, 40,
10, 73, 6, 83, 64, 50, 13, 22, 58, 45, 21, 57, 60, 72, 82, 26, 33 y 35. En el conjunto 10, se usaron los genes 18, 31,
52, 70, 48, 76, 57, 66, 10, 14, 60, 30, 67, 45, 35, 51, 1, 79, 46, 71, 3, 42, 33, 85, 4, 61, 2, 63, 87, 50, 36, 37, 90, 80,
24, 6, 77, 28, 21, 88, 17, 82, 83, 49, 75, 54, 25, 5, 7, 73, 59, 29, 69, 47, 65, 19, 15, 56, 9, 55, 58, 40, 20, 89 y 74.
5
10
15
20
25
30
35
40
45
50
55
60
65
Para el conjunto 1 de 70 genes se usaron los genes 79, 50, 38, 63, 74, 71, 66, 4, 33, 1, 69, 88, 85, 18, 27, 77, 70,
65, 14, 40, 64, 29, 59, 6, 3, 9, 84, 22, 62, 60, 30, 7, 11, 13, 45, 57, 35, 72, 15, 75, 39, 36, 10, 53, 67, 80, 83, 31, 5,
25, 90, 89, 58, 23, 56, 2, 16, 41, 76, 47, 26, 43, 17, 55, 82, 87, 24, 12, 48 y 81. En el conjunto 2, se usaron los genes 6, 66, 68, 83, 77, 81, 21, 88, 18, 60, 50, 17, 13, 61, 14, 25, 39, 76, 75, 78, 89, 37, 87, 59, 55, 90, 9, 5, 12, 10, 43, 29, 51, 31, 46, 58, 49, 24, 52, 28, 64, 42, 8, 11, 67, 84, 70, 19, 41, 45, 71, 16, 33, 23, 34, 30, 86, 69, 4, 57, 47, 80, 20, 82, 2, 1, 56, 65, 62 y 48. En el conjunto 3, se usaron los genes 72, 87, 89, 53, 56, 17, 84, 60, 45, 61, 62, 76, 13, 37,
20, 21, 2, 23, 3, 57, 83, 90, 82, 49, 24, 59, 9, 48, 32, 33, 47, 42, 78, 88, 65, 52, 79, 41, 34, 19, 74, 66, 43, 27, 36, 63,
81, 44, 40, 80, 31, 86, 12, 29, 77, 67, 14, 71, 68, 1, 35, 16, 10, 30, 6, 22, 75, 55, 85 y 4. En el conjunto 4, se usaron
los genes 70, 81, 71, 17, 8, 59, 6, 15, 52, 74, 23, 9, 19, 14, 82, 86, 27, 73, 66, 38, 22, 41, 88, 76, 47, 58, 56, 11, 55,
64, 44, 84, 62, 21, 35, 80, 36, 28, 12, 13, 4, 1, 75, 60, 5, 87, 89, 2, 50, 46, 25, 85, 37, 90, 78, 34, 24, 18, 45, 79, 77,
30, 32, 51, 57, 67, 83, 68, 54 y 29. En el conjunto 5, se usaron los genes 70, 23, 22, 30, 85, 48, 21, 32, 86, 84, 78,
87, 64, 40, 4, 34, 67, 19, 25, 7, 55, 42, 65, 53, 49, 83, 50, 80, 62, 16, 37, 77, 71, 54, 28, 27, 29, 18, 13, 57, 79, 56,
15, 36, 5, 24, 3, 1, 75, 90, 73, 47, 51, 88, 38, 58, 66, 81, 35, 76, 43, 46, 82, 68, 10, 14, 8, 41, 39 y 59. En el conjunto
6, se usaron los genes 88, 3, 40, 60, 24, 43, 62, 85, 58, 53, 39, 56, 59, 81, 71, 63, 25, 16, 22, 14, 10, 72, 89, 90, 84,
5, 33, 12, 45, 57, 70, 38, 32, 19, 44, 46, 2, 64, 8, 49, 42, 27, 37, 29, 13, 6, 28, 7, 77, 41, 17, 50, 31, 69, 26, 83, 23,
73, 80, 51, 61, 76, 82, 18, 15, 78, 67, 54, 36 y 65. En el conjunto 7, se usaron los genes 35, 52, 48, 42, 65, 38, 61, 79, 23, 20, 12, 8, 53, 57, 22, 54, 69, 9, 56, 43, 5, 66, 86, 49, 81, 19, 40, 45, 85, 60, 10, 50, 55, 11, 15, 73, 13, 2, 29,
59, 78, 67, 18, 80, 84, 39, 87, 90, 58, 46, 17, 32, 7, 62, 14, 34, 27, 6, 83, 70, 51, 26, 68, 21, 82, 77, 44, 47, 24 y 37. En el conjunto 8, se usaron los genes 40, 55, 22, 47, 86, 19, 62, 51, 25, 59, 8, 65, 48, 79, 1, 66, 17, 70, 32, 49, 23,
61, 85, 28, 36, 54, 20, 39, 83, 73, 50, 4, 81, 27, 41, 63, 15, 80, 87, 7, 46, 33, 9, 68, 56, 77, 14, 75, 82, 74, 12, 37, 16, 84, 72, 30, 2, 38, 13, 57, 76, 5, 64, 45, 89, 58, 29, 10, 78 y 90. En el conjunto 9, se usaron los genes 84, 16, 21, 81, 89, 60, 79, 30, 47, 69, 83, 85, 75, 52, 49, 72, 86, 3, 9, 59, 18, 55, 17, 82, 14, 23, 38, 24, 87, 65, 77, 80, 66, 19, 41, 53, 1, 34, 27, 56, 40, 67, 32, 20, 37, 70, 36, 15, 22, 8, 29, 48, 58, 45, 25, 71, 7, 4, 73, 10, 12, 2, 42, 90, 63, 43, 51, 6, 54 y 78. En el conjunto 10, se usaron los genes 19, 51, 29, 22, 66, 13, 32, 89, 62, 45, 65, 35, 24, 73, 55, 47, 67, 76,
69, 26, 37, 64, 53, 10, 15, 34, 79, 2, 56, 30, 3, 20, 78, 31, 75, 46, 27, 52, 6, 86, 16, 9, 54, 87, 58, 33, 61, 11, 43, 40,
74, 60, 50, 25, 80, 72, 83, 57, 38, 1, 70, 5, 7, 77, 85, 59, 88, 63, 14 y 84.
Para el conjunto 1 de 75 genes se usaron los genes 87, 17, 52, 44, 57, 53, 78, 37, 2, 71, 9, 68, 6, 63, 50, 58, 13, 26,
16, 60, 67, 3, 32, 21, 79, 12, 77, 73, 24, 35, 80, 47, 29, 40, 30, 84, 39, 90, 11, 81, 75, 76, 89, 66, 86, 42, 34, 64, 54,
7, 41, 56, 62, 55, 46, 28, 5, 25, 27, 83, 19, 20, 49, 69, 85, 33, 18, 23, 74, 1, 10, 43, 22, 8 y 45. En el conjunto 2, se
usaron los genes 75, 33, 52, 86, 24, 50, 70, 10, 17, 90, 28, 46, 48, 77,47, 61, 12, 4, 83, 27, 45, 88, 35, 36, 22, 68, 73,
31, 57, 69, 65, 64, 15, 9, 54, 39, 14, 20, 67, 79, 44, 38, 78, 23, 84, 37, 66, 5, 11, 18, 41, 13, 21, 49, 16, 76, 1, 29, 53,
40, 42, 63, 25, 56, 6, 82, 71, 85, 89, 80, 34, 51, 60, 30 y 58. En el conjunto 3, se usaron los genes 39, 82, 36, 31, 52, 84, 30, 83,49, 1, 44, 10, 87, 78, 77, 18, 79, 9, 73, 69, 75, 45, 14, 16, 56, 40, 58, 15, 32, 34, 42, 60, 19, 63, 47, 41, 68,
13, 61, 90, 89, 5, 46, 57, 8, 37, 66, 43, 21, 17, 11, 72, 74, 4, 33, 53, 12, 65, 50, 2, 81, 24, 62, 6, 23, 25, 88, 51, 67,
64, 7, 80, 54, 22 y 3. En el conjunto 4, se usaron los genes 63, 2, 5, 52, 10, 62, 75, 4, 6, 51, 29, 54, 49, 55, 36, 37,
77, 46, 44, 79, 11, 59, 38, 14, 65, 43, 48, 35, 86, 78, 73, 72, 57, 8, 16, 58, 56, 82, 60, 42, 80, 13, 9, 90, 53, 66, 21, 67, 88, 89, 45, 22, 71, 31, 84, 74, 15, 23, 26, 3, 68, 1, 39, 7, 50, 41, 40, 81, 87, 34, 18, 12, 70, 47 y 25. En el conjunto 5, se usaron los genes 62, 82, 46, 89, 81, 43, 57, 69, 9, 19, 18, 16, 80, 63, 72, 2, 54, 86, 44, 53, 31, 5, 1, 61, 20, 37, 58, 32, 28, 47, 34, 6, 41, 68, 15, 90, 85, 13, 23, 10, 4, 70, 76, 33, 11, 51, 35, 88, 67, 84, 8, 24, 66, 65, 26, 59, 40, 79, 64, 42, 45, 22, 17, 87, 30, 12, 27, 14, 39, 56, 38, 71, 52, 36 y 60. En el conjunto 6, se usaron los genes 16, 85, 19, 39, 64, 76, 44, 15, 50, 73, 27, 36, 6, 62, 54, 46, 58, 68, 28, 13, 14, 21, 86, 47, 71, 87, 18, 5, 67, 1, 65, 78, 12, 66, 43,
82, 38, 23, 75, 24, 49, 57, 17, 10, 29, 72, 22, 89, 90, 26, 42, 45, 2, 33, 41, 9, 8, 7, 69, 31, 30, 79, 80, 84, 55, 35, 20,
70, 83, 48, 88, 60, 25, 74 y 63. En el conjunto 7, se usaron los genes 24, 66, 86, 48, 63, 51, 74, 37, 2, 82, 77, 22, 72,
21, 11, 90, 80, 55, 76, 68, 34, 42, 29, 62, 46, 39, 56, 31, 47, 28, 16, 38, 44, 52, 1, 43, 14, 20, 64, 83, 78, 58, 12, 18,
84, 67, 75, 85, 36, 25, 50, 49, 40, 33, 23, 45, 41, 73, 88, 59, 17, 32, 70, 13, 60, 57, 3, 7, 54, 4, 8, 53, 26, 15 y 69. En el conjunto 8, se usaron los genes 80, 38, 59, 41, 85, 44, 12, 22, 39, 17, 52, 24, 32, 62, 18, 8, 78, 74, 9, 66, 76, 14, 3, 16, 40, 28, 48, 58, 54, 29, 43, 5, 81, 77, 86, 23, 75, 82, 34, 7, 51, 64, 4, 6, 72, 61, 37, 84, 45, 33, 71, 19, 67, 88, 1, 35, 47, 83, 25, 49, 11, 42, 50, 70, 2, 46, 15, 26, 27, 68, 57, 65, 13, 53 y 90. En el conjunto 9, se usaron los genes 4,
66, 28, 44, 20, 34, 12, 85, 6, 17, 88, 8, 39, 65, 22, 19, 10, 48, 63, 23, 33, 13, 47, 81, 79, 89, 64, 53, 87, 11, 46, 74,
14, 70, 37, 62, 30, 7, 71, 76, 50, 59, 77, 51, 15, 68, 55, 72, 83, 82, 78, 54, 25, 21, 27, 41, 69, 9, 58, 3, 31, 75, 84, 26, 86, 49, 18, 42, 61, 45, 16, 2, 24, 80 y 73. En el conjunto 10, se usaron los genes 78, 47, 32, 30, 46, 6, 2, 64, 11, 27,
85, 22, 79, 63, 80, 39, 90, 65, 71, 72, 21, 26, 58, 15, 16, 23, 81, 1, 44, 43, 40, 55, 13, 19, 25, 83, 41, 18, 53, 68, 37, 20, 49, 69, 33, 61, 38, 28, 60, 45, 17, 82, 24, 4, 86, 89, 36, 51, 84, 31, 14, 88, 59, 76, 48, 5, 35, 75, 74, 7, 67, 62, 52, 56 y 54.
Para el conjunto 1 de 80 genes se usaron los genes 29, 80, 5, 50, 63, 3, 1, 55, 38, 48, 58, 30, 86, 82, 83, 6, 23, 2,
41, 60, 54, 69, 15, 34, 64, 10, 27, 70, 28, 44, 8, 68, 56, 14, 36, 17, 73, 13, 88, 42, 72, 59, 67, 71, 26, 53, 37, 24, 79,
62, 52, 74, 4, 40, 47, 19, 78, 11, 76, 31, 90, 12, 87, 89, 75, 66, 81, 16, 49, 65, 57, 84, 46, 20 y 21. En el conjunto 2,
se usaron los genes 15, 21, 70, 5, 79, 85, 84, 53, 69, 33, 28, 14, 75, 76, 58, 48, 13, 45, 51, 88, 25, 74, 39, 71, 64, 9,
60, 44, 78, 7, 8, 3, 32, 89, 73, 1, 4, 29, 41, 17, 46, 57, 72, 20, 86, 47, 49, 87, 55, 19, 37, 27, 80, 62, 54, 18, 52, 67,
63, 77, 65, 24, 31, 26, 83, 2, 22, 90, 50, 12, 16, 35, 11, 10 y 56. En el conjunto 3, se usaron los genes 41, 4, 59, 73, 29, 22, 60, 45, 70, 10, 64, 21, 81, 36, 52, 67, 54, 38, 65, 90, 27, 87, 28, 7, 74, 43, 56, 75, 9, 35, 42, 20, 72, 47, 14, 63, 18, 68, 23, 69, 8, 50, 89, 3, 11, 82, 39, 80, 46, 16, 53, 58, 25, 79, 49, 76, 37, 30, 78, 83, 2, 84, 57, 88, 6, 32, 12,
71, 15, 55, 48, 34, 62, 61 y 13. En el conjunto 4, se usaron los genes 23, 31, 53, 90, 3, 40, 34, 6, 1, 83, 9, 60, 56, 50,
5
10
15
20
25
30
35
40
45
50
55
60
65
44, 85, 51, 35, 43, 80, 65, 46, 38, 88, 17, 54, 87, 10, 45, 42, 75, 68, 63, 58, 36, 64, 67, 77, 21, 47, 30, 59, 14, 49, 70,
66, 72, 74, 27, 61, 19, 81, 20, 25, 33, 57, 62, 76, 55, 78, 84, 16, 69, 37, 79, 29, 39, 32, 15, 5, 2, 12, 71, 11 y 73. En el
conjunto 5, se usaron los genes 29, 71, 21, 60, 43, 78, 55, 61, 51, 90, 10, 37, 35, 53, 28, 62, 15, 1, 31, 67, 48, 36, 75, 27, 63, 87, 24, 32, 54, 79, 16, 70, 64, 40, 47, 41, 17, 38, 3, 45, 81, 68, 72, 56, 77, 8, 13, 34, 57, 26, 73, 14, 6, 82, 4,
58, 89, 30, 7, 74, 69, 88, 20, 5, 46, 2, 11, 49, 50, 23, 33, 42, 83, 52 y 86. En el conjunto 6, se usaron los genes 39,
54, 30, 24, 80, 10, 21, 7, 14, 69, 38, 83, 52, 65, 46, 42, 66, 36, 61, 16, 50, 33, 2, 73, 13, 81, 48, 8, 6, 41, 12, 25, 43, 79, 35, 26, 89, 75, 60, 67, 82, 45, 20, 90, 68, 77, 58, 34, 18, 47, 22, 84, 4, 57, 32, 5, 19, 59, 86, 74, 1, 31, 62, 85, 29,
53, 88, 28, 40, 37, 63, 15, 64, 49 y 55. En el conjunto 7, se usaron los genes 21, 68, 81, 50, 36, 6, 80, 76, 90, 74, 12,
79, 34, 53, 1, 4, 5, 41, 56, 47, 15, 63, 11, 14, 7, 78, 57, 65, 73, 20, 8, 64, 84, 30, 3, 13, 52, 49, 27, 86, 60, 72, 62, 29,
75, 40, 32, 2, 82, 33, 10, 24, 51, 17, 46, 38, 19, 37, 28, 69, 61, 85, 88, 22, 48, 89, 18, 25, 71, 58, 31, 35, 26, 55 y 44. En el conjunto 8, se usaron los genes 30, 64, 67, 79, 52, 71, 13, 3, 22, 8, 75, 41, 65, 21, 60, 36, 49, 84, 33, 29, 57, 86, 15, 12, 85, 63, 6, 20, 66, 53, 51, 90, 87, 55, 11, 32, 31, 61, 78, 58, 42, 48, 5, 1, 17, 50, 70, 76, 25, 45, 2, 73, 28,
14, 89, 56, 39, 44, 7, 74, 16, 72, 35, 19, 47, 27, 43, 83, 68, 26, 18, 37, 69, 54 y 23. En el conjunto 9, se usaron los
genes 79, 85, 48, 29, 23, 31, 62, 37, 5, 33, 3, 19, 53, 9, 36, 18, 58, 17, 81, 46, 8, 35, 66, 87, 14, 30, 74, 77, 21, 40, 75, 43, 42, 15, 39, 70, 60, 13, 10, 2, 72, 44, 45, 38, 4, 25, 84, 68, 50, 24, 7, 27, 82, 55, 80, 32, 89, 57, 6, 69, 83, 28,
56, 22, 16, 1, 41, 63, 26, 78, 12, 59, 64, 61 y 11. En el conjunto 10, se usaron los genes 45, 9, 24, 85, 68, 80, 73, 17,
56, 7, 8, 5, 69, 58, 37, 44, 21, 29, 50, 15, 53, 25, 40, 88, 36, 32, 59, 75, 49, 35, 43, 67, 83, 31, 51, 28, 60, 77, 30, 74,
22, 41, 42, 64, 61, 23, 90, 13, 33, 11, 16, 20, 46, 66, 6, 87, 39, 47, 65, 3, 82, 10, 72, 34, 18, 1, 38, 57, 79, 71, 26, 27,
19,48 y 76.
Para el conjunto 1 de 85 genes se usaron los genes 62, 19, 38, 77, 64, 49, 14, 16, 47, 73, 28, 3, 54, 78, 70, 12, 75,
35, 15, 40, 21, 60, 58, 86, 83, 33, 66, 59, 44, 45, 56, 9, 5, 81, 72, 68, 27, 37, 71, 52, 48, 36, 79, 6, 41, 74, 22, 46, 2,
20, 34, 13, 55, 53, 10, 88, 57, 61, 4, 39, 24, 85, 76, 87, 65, 25, 23, 90, 32, 26, 80, 63, 89, 82 y 7. En el conjunto 2, se
usaron los genes 72, 30, 36, 64, 47, 57, 67, 20, 58, 1, 6, 61, 71, 32, 42, 53, 87, 65, 25, 17, 9, 60, 83, 12, 51, 8, 37, 75, 59, 89, 85, 22, 44, 19, 63, 7, 62, 13, 81, 41, 79, 43, 49, 4, 34, 68, 88, 74, 28, 31, 10, 39, 11, 55, 15, 5, 69, 50, 66, 18, 77, 46, 76, 33, 3, 35, 38, 14, 40, 86, 54, 23, 24, 48 y 78. En el conjunto 3, se usaron los genes 5, 67, 57, 18, 12, 42, 43, 71, 50, 19, 26, 51, 52, 32, 74, 88, 46, 2, 9, 77, 30, 58, 69, 81, 35, 87, 90, 34, 22, 15, 84, 44, 8, 3, 47, 60, 55,
66, 33, 20, 86, 39, 16, 37, 85, 73, 4, 13, 56, 27, 65, 76, 49, 54, 75, 31, 68, 82, 23, 62, 7, 53, 78, 36, 64, 40, 45, 6, 70,
17, 79, 10, 21, 48 y 89. En el conjunto 4, se usaron los genes 67, 47, 68, 38, 50, 82, 54, 56, 64, 49, 63, 14, 22, 7, 25,
12, 57, 85, 88, 5, 28, 23, 77, 44, 80, 89, 83, 20, 81, 73, 11, 17, 76, 75, 32, 34, 55, 62, 21, 6, 30, 10, 71, 39, 36, 74,
42, 60, 43, 8, 59, 58, 65, 3, 61, 72, 70, 79, 16, 13, 18, 19, 45, 4, 84, 1, 87, 26, 46, 40, 37, 78, 15, 69 y 41. En el
conjunto 5, se usaron los genes 82, 42, 35, 86, 14, 37, 39, 30, 41, 60, 44, 9, 12, 34, 50, 68, 5, 29, 46, 19, 11, 28, 48, 3, 20, 77, 67, 57, 88, 55, 32, 78, 51, 71, 47, 63, 6, 10, 45, 70, 8, 81, 18, 43, 69, 79, 21, 13, 66, 59, 33, 1, 31, 74, 36, 2, 24, 54, 23, 85, 72, 73, 80, 64, 84, 7, 38, 87, 58, 75, 22, 65, 15, 53 y 52. En el conjunto 6, se usaron los genes 55, 2, 11, 72, 4, 85, 43, 18, 46, 27, 80, 69, 9, 31, 39, 5, 81, 22, 32, 3, 36, 17, 83, 37, 90, 38, 87, 44, 56, 66, 13, 6, 28, 77,
54, 79, 41, 78, 47, 29, 8, 21, 63, 64, 73, 48, 14, 34, 82, 70, 30, 58, 84, 24, 26, 68, 1, 65, 60, 42, 33, 20, 7, 75, 12, 57,
59, 16, 74, 88, 23, 49, 50, 40 y 71. En el conjunto 7, se usaron los genes 18, 40, 66, 35, 20, 85, 12, 19, 86, 26, 36,
89, 84, 88, 74, 15, 33, 75, 50, 16, 49, 32, 38, 31, 2, 27, 87, 68, 69, 53, 60, 79, 7, 21, 63, 17, 90, 30, 29, 11, 56, 25,
58, 62, 48, 8, 45, 9, 72, 64, 28, 76, 3, 78, 46, 1, 10, 34, 43, 83, 5, 52, 14, 65, 51, 41, 22, 44, 61, 24, 70, 54, 59, 77 y
13. En el conjunto 8, se usaron los genes 35, 40, 80, 57, 23, 28, 9, 83, 13, 47, 82, 36, 86, 44, 90, 55, 30, 22, 12, 42,
38, 49, 45, 8, 87, 17, 52, 3, 33, 15, 32, 21, 76, 58, 7, 53, 20, 67, 19, 29, 85, 68, 71, 39, 24, 25, 84, 4, 6, 75, 63, 73, 5,
18, 31, 48, 65, 41, 60, 37, 88, 72, 1, 46, 79, 16, 78, 10, 77, 34, 66, 56, 61, 70 y 2. En el conjunto 9, se usaron los
genes 51, 59, 73, 9, 79, 21, 39, 67, 71, 68, 28, 65, 85, 30, 41, 61, 29, 8, 16, 78, 34, 1, 77, 90, 45, 33, 60, 89, 49, 56,
43, 62, 83, 6, 11, 18, 50, 66, 47, 19, 4, 22, 13, 27, 86, 26, 20, 17, 52, 10, 70, 54, 42, 53, 24, 76, 81, 75, 38, 64, 74,
36, 48, 32, 82, 44, 37, 57, 72, 35, 7, 14, 15, 3 y 23. En el conjunto 10, se usaron los genes 18, 85, 61, 1, 52, 87, 42, 13, 88, 66, 46, 57, 50, 36, 75, 39, 14, 27, 54, 20, 53, 10, 4, 30, 37, 43, 79, 80, 40, 84, 76, 45, 60, 74, 12, 31, 15, 44,
48, 3, 56, 11, 68, 19, 86, 72, 6, 9, 21, 70, 34, 83, 89, 5, 69, 64, 22, 24, 63, 65, 55, 8, 41, 28, 2, 16, 35, 77, 26, 47, 90,
49, 59, 23 y 17.
Ejemplo 5: Detección basada en PCR
Como se ha indicado anteriormente, la determinación o medición de expresión génica puede realizarse por PCR, tal como el uso de PCR cuantitativa. Puede usarse detección de la expresión de 50 o más secuencias expresadas en el genoma humano en dichas realizaciones de la invención. Adicionalmente, también pueden usarse niveles de expresión de 50 o más secuencias génicas en el conjunto de 74, el conjunto de 90, o un conjunto de combinación de los dos (con un total de 126 secuencias génicas dada la presencia de 38 secuencias génicas en común entre los dos conjuntos). La invención contempla el uso de PCR cuantitativa para medir los niveles de expresión, como se ha descrito anteriormente, de 87 secuencias génicas (o 50 o más secuencias de las mismas), todas las cuales están presentes en el conjunto de 74 o el conjunto de 90. De las 87 secuencias génicas, 60 están presentes en el conjunto de 74, y 63 están presentes en el conjunto de 90. Los identificadores/números de referencia de las 87 secuencias génicas son AA456140, AA745593, AA765597, AA782845, AA865917, AA946776, AA993639, AB038160, AF104032, AF133587, AF301598, AF332224, AI041545, AI147926, AI309080, AI341378, AI457360, AI620495, AI632869, AI683181, AI685931, AI802118, AI804745, AI952953, AI985118, AJ000388, AK025181, AK027147, AK054605, AL023657, AL039118, AL110274, AL157475, AW118445, AW194680, AW291189, AW298545, AW445220, AW473119, AY033998, BC000045, BC001293, BC001504, BC001639, BC002551, BC004331, BC004453, BC005364, BC006537, BC006811, BC006819, BC008764, BC008765, BC009084, BC009237,
5
10
15
20
25
30
35
40
45
50
55
60
65
BC010626, BC011949, BC012926, BC013117, BC015754, BC017586, BE552004, BE962007, BF224381, BF437393, BF446419, BF592799, BI493248, H05388, H07885, H09748, M95585, N64339, NM_000065, NM_001337, NM_003914, NM_004062, NM_004063, NM_004496, NM_006115, NM_019894, NM_033229, R15881, R45389, R61469, X69699 y X96757.
El uso de 50 a todas estas secuencias en la práctica de la invención puede incluir el uso de niveles de expresión medidos para secuencias génicas de referencia como se describe en el presente documento. En algunas realizaciones, las secuencias génicas de referencia son una o más de las 8 desveladas en el presente documento. La invención contempla el uso de una o más de las secuencias de referencia identificadas por AF308803, AL137727, BC003043, BC006091 y BC016680 en realizaciones basadas en PCR o QPCR de la invención. Por supuesto también pueden usarse las 5 secuencias de referencia.
Realizaciones de la invención.
1. Un método para clasificar una muestra que contiene células, que contiene células tumorales de un tipo de tejido, comprendiendo dicho método:
determinar los niveles de expresión de 50 a 350 secuencias transcritas de células en una muestra que contiene células obtenidas de un sujeto humano, y
clasificar la muestra que contiene células tumorales de un tipo de tejido de una pluralidad de tipos de tumores en base a los niveles de expresión de dichas secuencias.
2. Un método para clasificar una muestra que contiene células, que contiene células tumorales de un tipo de tejido, comprendiendo dicho método:
determinar los niveles de expresión de 50 o más secuencias transcritas de células en una muestra que contiene células obtenida de un sujeto humano, y
clasificar la muestra que contiene células tumorales de un tipo de tejido de una pluralidad de tipos de tumores basándose en los niveles de expresión de dichas secuencias,
en donde a) la expresión de más del 50% de dichas secuencias transcritas no está correlacionada con la expresión de otra de dichas secuencias transcritas, o
b) las 50 o más secuencias transcritas no se seleccionan en base a su aprendizaje supervisado usando muestras tumorales conocidas, en el nivel de correlación entre su expresión y dicha pluralidad de tipos de tumores, o en su rango en una correlación entre su expresión y dicha pluralidad de tipos de tumores.
3. El método de la realización 1 o 2, que además comprende determinar los niveles de expresión de un exceso de numero de secuencias transcritas, cuyos niveles de expresión no son usados en dicha clasificación.
4. El método de la realización 3 donde dichos niveles de expresión se determinan media el uso de un microarray.
5. El método de la realización 1 o 2 o 3 o 4 donde dicha clasificación es con una precisión del 60% o superior.
6. El método de la realización 1 o 2 o 3 o 4 donde dichas 50 o más secuencias transcritas comprenden una o más seleccionadas del conjunto de 74 secuencias génicas o del conjunto de 90 secuencias génicas.
7. El método de la realización 6 donde dichas 50 o más secuencias transcritas comprenden cinco o más seleccionadas del conjunto de 74 secuencias génicas o del conjunto de 90 secuencias génicas.
8. El método de la realización 1 o 2 o 3 o 4 o 5 o 6 o 7 donde dicha determinación comprende la medición en comparación con una o más secuencias transcritas de referencia.
9. El método de la realización 1 o 2 o 3 o 4 o 5 o 6 o 7 o 8 donde dicha determinación comprende la medición de la expresión de toda o parte de las secuencias transcritas.
10. El método de cualquiera de las realizaciones 1 a 9 donde dicha determinación comprende la amplificación de toda o parte de las secuencias transcritas, o transcripción reversa y el marcado del ARN correspondiente a dichas secuencias transcritas.
11. El método de la realización 10 donde dicha amplificación comprende la amplificación de ARN lineal o PCR cuantitativa.
5
10
15
20
25
30
35
40
45
50
55
60
65
12. El método de la realización 10 donde dicha amplificación es de la presente secuencia dentro de 600 nucleótidos de los sitios de poliadenilación de los transcritos.
13. El método de la realización 10 donde dicha amplificación es una amplificación con PCR cuantitativa de al menos 50 nucleótidos de los transcritos.
14. Un microarray que comprende sondas de oligonucleótidos para detectar los productos de amplificación de la realización 10.
15. El método de cualquiera de las realizaciones 1 a 9 donde dichas secuencias transcritas se seleccionan para ser no redundantes.
16. El método de la realización 15, que además comprende determinar los niveles de expresión de un exceso de numero de secuencias transcritas las cuales son redundantes a las usadas para dicha clasificación.
17. El método de cualquiera de las realizaciones 1 a 9 donde dicha muestra es una muestra clínica de un paciente humano.
18. El método de la realización 17, donde dicha muestra es una muestra fijada en formalina e incrustada en parafina (FFPE).
19. El método de cualquiera de las realizaciones 1 a 9 que además comprende, antes de dicha determinación de los niveles de expresión de 50 o más secuencias transcritas,
diagnóstico de un sujeto humano que necesita dicha determinación; u
obtención de una muestra que contiene célula de un sujeto humano; o
recepción de una muestra que contiene célula; o
seccionar una muestra que contiene célula; o
aislar células de una muestra que contiene células; o
obtención de ARN de células de una muestra que contiene célula.
20. El método de cualquiera de las realizaciones 1 a 9, que además comprende, después de dicha determinación de los niveles de expresión de 50 o más secuencias transcritas y dicha clasificación de la muestra,
procesamiento de reembolso o pago por dicha determinación o clasificación indicando que 1) el pago ha sido recibido, o 2) el pago será realizado por otro pagador, o 3) el pago permanece sin pagar; o
recibir un reembolso por dicha determinación o dicha clasificación; o
reenviar o haber enviado una solicitud de reembolso a una compañía de seguros, organización de mantenimiento de la salud, agencia federal de salud, o a dicho paciente para dicha determinación o clasificación; o
recibir indicación de aprobación para el pago o denegación de pago para dicha determinación o clasificación; o
enviar una solicitud de reembolso para dicha determinación o clasificación; o
indicar la necesidad de reembolso o pago en un formulario o en una base de datos para dicha determinación o clasificación; o
indicando el funcionamiento de dicha determinación o clasificación en un formulario o en una base de datos; o
informar de los resultados de dicha determinación o clasificación, opcionalmente a un centro de salud, a un proveedor de atención médica, un médico, una enfermera o dicho paciente; o recibir un pago de dicho paciente por la realización de dicha determinación o clasificación.
LISTADO DE SECUENCIAS
<110> Arcturus Bioscience, Inc. Erlander, Mark G.
Ma, Xiao-Jun
<120> Identificación de tumores
5 <130> 022041-002020PC
<150> US 60/577.084 <151>
10 <160> 268
<170> PatentIn versión 3.1 <210> 1
15 <211> 2930
<212> ADN <213> Homo sapiens
<400> 1
20
ggccactctg cagacagctc cagacaatca ggcactcgtc acacagagtc ttcctctcgt 60 ggacaggctg cgtcatccca tgaacaggca agatcaagtg caggagaaag acatggatcc 120 caccaccagc agtcagcaga cagctccaga cacgcaggca ttgggcacgg acaagcttca 180 tctgcagtca gagacagtgg acaccgaggg tacagaggta gtcaggccac tgacagtgag 240 ggacattcag aagactcaga cacacagtca gtgtcagcac agggacaagc tgggccccat 300 cagcagagcc accaagagtc cgcacgtggc cagtcagggg aaagctctgg acgttcaggg 360 tctttcctct accaggtgag cactcatgaa cagtctgagt ccacccatgg acagtctgtg 420 cccagcactg gaggaagaca aggatcccac catgatcagg cacaagacag ctccaggcac 480 tcagcatccc aagagggtca ggacaccatt cgtggacacc cggggcoaag cagaggagga 540 agacaggggt cccaccacga gcaatcggta gataggtctg gacactcagg gtcccatcac 600 agccacacca catcccaggg aaggtctgat gcctcccgtg ggcagtcagg atccagaagt 660 gcaagcagac aaacacatga ccaggaacaa tcaggagacg gctctaggca ctcagggtcg 720 cgtcatcagg aagcttcctc ttgggccgac agctctagac actcacaggc agtccaggga 780 caatcagagg ggtccaggac aagcaggcgc cagggatcca gtgttagcca ggacagtgac 840 agtcagggac actcagaaga ctctgagagg cggtctgggt ctgcttccag aaaccatcgt 900 ggatctgctc aggagcagtc aagagatggc tccagacacc ccaggtccca tcacgaagac 960 agagccggtc acggggactc tgcagagagc tccagacaat caggcactca tcatgcagag 1020 aattcctctg gtggacaggc tgcatcatcc catgaacagg caagatcaag tgcaggagag 1080 agacatggat cccactacca gcagtcagca gacagctcca gacactcagg cattgggcac 1140 ggacaagctt catctgcagt cagagacagt ggacaccgag ggtccagtgg tagtcaggcc 1200 agtgacaatg agggacattc agaagactca gacacacagt cagtgtcagc ccaccgacag 1260 gctgggcgcc atcacgagag ccaccaagag tccacacgtg gccggtcacg aggaaggtct 1320 ggacgttcag ggtctttcct ctaccaggtg agcacteatg aacagtctga gtctgcccat 1380 ggacgggctg ggcccagtac tggaggaaga caaggatccc gccacgagca ggcacgagac 1440 agctccaggc actcagcgtc ccaagagggt caggacacca ttcgtggaca cccggggtca 1500 aggagaggag gaagacaggg atcctaccac gagcaatcgg tagataggtc tggacactca 1560 gggtcccatc acagccacac cacatcccag ggaaggtctg atgcctccca tgggcagtca 1620 ggatccagaa gtgcaagcag agaaacacgt aatgaggaac agtcaggaga cggctccagg 1680 cactcagggt cgcgtcacca tgaagcttcc actcaggctg acagctctag acactcacag 1740 tccggccagg gtgaatcagc ggggtccagg agaagcaggc gccagggatc cagtgttagc 1800 caggacagtg acagtgaggc atacccagag gactctgaga ggcgatctga gtctgcttcc 1860 agaaaccatc atggatcttc tcgggagcag tcaagagatg gctccagaca ccccggatcc 1920
5
10
tctcaccgcg atacagccag tcatgtácag tcttcacctg tacagtcaga cíctagtacc 1980 gctaaggaac atggtcactt tagtagtctt tcacaagatt ctgcgtatca ctcaggaata 2040 cagtcacgtg gcagtcctca cagttctagt tcttatcatt atcaatctga gggcactgaa 2100 aggcaaaaag gtcaatcagg tttagtttgg agacatggca gctatggtag tgcagattat 2160 gattatggtg aatccgggtt tagacactct cagcacggaa gtgttagtta caattccaat 2220 cctgttcttt tcaaggaaag atctgatatc tgtaaagcaa gtgcgtttgg taaagatcat 2280 ccaaggtatt atgcaacgta tattaataag gacccaggtt tatgtggcca ttctagtgat 2340 atatcgaaac aactgggatt tagtcagtca cagagatact attactatga gtaagaaatt 2400 aatggcaaag gaattaatcc aagaatagaa gaatgaagca agttcacttt caatcaagaa 2460 acttcataat actttcaggg aagttatctt ttcctgtcaa tctgtttaaa atatgctata 2520 gtatttcatt agtttggtgg taacttattt ttattgÉgta atgatcttta aacgctatat 2580 ttcagaaata ttaaatggaa gaaatcaata tcatggagag ctaactttag aaaactagct 2640 ggagtatttt aggagattct gggtcaagta atgttttatg tttttgaaag tttaagtttt 2700 agacactccc caaatttcta aattaatctt tttcagaaat atcgaaggag ccaaaaatat 2760 aaaacagttc tgatatccaa agtggctata tcaacatcag ggctagcaca tctttctcta 2S20 ttatccttct attggaattc tagtattctg tattcaaaaa atcatcttgg acataattaa 2880 tattttagta agctgcatct aaattaaaaa taaactattc atcatataat 2930
<210>2 <211> 1591 <212> ADN <213> Homo sapiens
<400>2
tagaatcggg ggtttcagct cac,tgctcct tttctttttt ttctttctct cccccgccca 60 cccccccaaa aataattgat ttgctttaca atcatccaca ctgtgttttg tggatcttta 120 attatatata acaatagtag tcattttaaa tatatattct gaaatctttg caaattttaa 180 cagaagagtc gaagctctgc gagacccaat atttgccaat aagaatggtt atgataatta 240 gcaccatgga gcctcaggtg tcaaatggtc cgacatccaa tacaagcaat ggaccctcca 300 gcaacaacag aaactgtcct tctcccatgc aaacaggggc aaccacagat gacagcaaaa 360 ccaacctcat cgtcaactat ttaccccaga atatgaccca agaagaattc aggagtctct 420 tcgggagcat tggtgaaata gaatcctgca aacttgtgag agacaaaatt acaggacaga 480 gtttagggta tggatttgtt aactatattg atccaaagga tgcagagaaa gccatcaaca 540 ctttaaatgg actcagactc cagaccaaaa ccataaaggt ctcatatgcc cgtccgagct 600 ctgcctcaat cagggaígct aacctctatg ttagcggcct tcccaaaacc atgacccaga 660 aggaactgga gcaacttttc tcgcaatacg gccgtatcat cacctcacga atccíggttg 720 atcaagtcac aggagtgtcc agaggggtgg gattcatccg ctttgataag aggattgagg 780 cagaagaagc catcaaaggg ctgaatggcc agaagcccag cggtgctacg gaaccgatta 840 ctgtgaagtt tgccaacaac cccagccaga agtccagcca ggccctgctc tcccagctct 900 accagtcccc taaccggcgc tacccaggtc cacttcacca ccaggctcag aggttcaggc 960 tggacaattt gcttaatatg gcctatggcg taaagagact gatgtctgga ccagtceccc 1020 cttctgcttg ttcccccagg ttctccccaa ttaccattga tggaatgaca agccttgtgg 1080 gaatgaacat ccctggtcac acaggaactg ggtggtgcat ctttgtctac aacctgtccc 1140 ccgattccga tgagagtgtc ctctggcagc tctttggccc ctttggagca gtgaacaacg 1200 taaaggtgat tcgtgacttc aacaccaaca agtgcaaggg attcggcttt gtcaccatga 1260 ccaactatga tgaggcggcc atggccatcg ccagcctcaa cgggtaccgc ctgggagaca 1320 gagtgttgca agtttccttt aaaaccaaca aagcccacaa gtcctgaatt tcccattctt 1380 acttactaaa atatatatag aaatatatac gaacaaaaca cacgcgcgca cacacacaca 1440 tacacgaaag agagagaaac aaacttttca aggctíatat tcaaccatgg actttataag 1500 ccagtgttgc ctaagtatta aaacattgga ttatcctgag gtgtaccagg aaaggatttt 1560 ataatgctta gaaaaaaaaa aaaaaaaaaa a 1591
<210> 3 <211> 2872 <212> ADN
<213> Homo sapiens <400>3
tccaggaatc gatagtgcat tcgtgcgcgc ggccgcccgt cgcttcgcac agggctggat 60 ggttgtattg ggcagggtgg ctccaggatg ttaggaactg tgaagatgga agggcatgaa 120 accagcgact ggaacagcta ctacgcagac acgcaggagg cctactcctc ggtcccggtc 180 agcaacatga actcaggcct gggctccatg aactccatga acacctacat gaccatgaac 240 accatgacta cgagcggcaa catgaccccg gcgtccttca acatgtccta tgccaacccg 300 gccttagggg ccggcctgag tcccggcgca gtagccggca tgccgggggg ctcggcgggc 360 gccatgaaca gcatgactgc ggccggcgtg acggccatgg gtacggcgct gagcccgagc 420 ggcatgggcg ccatgggtgc gcagcaggcg gcctccatga tgaatggcct gggcccctac 480 gcggccgcca tgaacccgtg catgagcccc atggcgtacg cgccgtccaa cctgggccgc 540 agccgcgcgg gcggcggcgg cgacgccaag acgttcaagc gcagttaccc gcacgccaag 600 ccgccctact cgtacatctc gcteatcacc atggccatcc agcgggcgcc cagcaagatg 660 ctcacgctga gcgagatcta ccagtggatc atggacctct tcccctatta ccggcagaac 720 cagcagcgct ggcagaactc catccgccac tcgctgtcct tcaatgactg cttcgtcaag 780 gtggcacgct ccccggacaa gccgggcaag ggcícctact ggacgctgca cccggactcc 840 ggcaacatgt tcgagaacgg ctgctacttg cgccgccaga agcgcttcaa gtgcgagaag 900 cagccggggg ccggcggcgg gggcgggagc ggaagcgggg gcagcggcgc caagggcggc 960 cctgagagcc gcaaggaccc ctctggcgcc tctaacccca gcgccgactc gcccctccat 1020 cggggtgtgc acgggaagac cggccagcta gagggcgcgc cggccccggg cccggccgcc 1080 agcccccaga ctctggacca cagtggggcg acggcgacag ggggcgcctc ggagttgaag 1140 actccagcct cctcaactgc gccccccata agctccgggc ccggggcgct ggcctctgtg 1200 cccgcctctc acccggcaca cggcttggca ccccacgagt cccagctgca cctgaaaggg 1260 gacccccact actccttcaa ccacccgttc tccatcaaca acctcatgtc ctcctcggag 1320 cagcagcata agctggactt caaggcatac gaacaggcac tgcaatactc gccttacggc 1380 tctacgttgc ccgccagccí gcctctaggc agcgcctcgg tgaccaccag gagccccatc 1440 gagccctcag ccctggagcc ggcgtactac caaggtgtgt attccagacc cgtcctaaac 1500 acttcctagc tcccgggact ggggggtttg tctggcatag ccatgctggt agcaagagag 1560 aaaaaatcaa cagcaaacaa aaccacacaa accaaaccgt caacagcata ataaaatcca 1620 acaactattt ttatttcatt tttcatgcac aaccttgccc ccagtgcaaa agactgttac 1680 tttattattg tattcaaaat tcattgtgta tattactaca aagacggccc caaaccaatt 1740 tttttcctgc gaagtttaat gatccacaag tgtatatatg aaattctcct ccttccttgc 1800 ccccctctct ttcttccctc ttggccctcc agacattcta gtttgtggag ggttatttaa 1860 aaaacaaaaa ggaagatggt caagtttgta aaatatttgt ttgtgctttt cccccctcct 1920 facctgaccc cctacgagtt tacaggcttg tggcaatact cttaaccata agaattgaaa 1980 tggtgaagaa acaagtatac actagaggct cttaaaagta ttgaaaagac aatactgctg 2040 ttatatagca agacataaac agattataaa catcagagcc atttgcttct cagtttacat 2100 ttctgataca tgcagatagc agatgtcttt aaatgaaata catgtatatt gtgtatggac 2160 ttaattatgc acatgctcag atgtgtagac atcctccgta tatttacata acatatagag 2220 gtaatagata ggtgatatac gtgatacgtt ctcaagagtt gcttgaccga aagttacaag 2280 gaccccaacc cctttgctct ctacccacag atggccctgg gaacaatcct caggaattgc 2340 cctcaagaac tcgcttcttt gctttgagag tgccatggtc atgtcattct gaggtacata 2400 acacataaat tagtttctai gagtgtatac catttaaaga ttttttcagt aaagggaata 2460 ttacatgttg ggaggaggag ataagttata gggagctgga tttcaaacgg tggtccaaga -2520 ttcaaaaatc ctattgatag tggccatttt aatcattgcc atcgtgtgct tgtttcatcc 2580 agtgttatgc actttccaca gttggtgtta gtatagccag agggtttcat tattatttct 2640 ctttgctttc tcaatgttaa tttattgcat ggtttattct ttttctttac agctgaaatt 2700 gctttaaatg atggttaaaa ttacaaatta aattgggaat ttttatcaat gtgattgtaa 2760 ttaaaaatat tttgatttaa ataacaaaaa taataccaga ttttaagccg cggaaaatgt 2820 tcttgatcat ttgcagttaa ggactttaaa taaatcaaat gttaacaaaa aa 2872
<210> 4 <211> 540
10
<212> ADN <213> Homo sapiens
<400>4
tgtttttcta gttcattttg tgttíccaac ttttcatgta aaattttaat tatttttgaa 60 tgtgtggatg tgagactgag gtgccttttg gtactgaaat tctttttcca tgtacctgaa 120 gtgttacttt tgtgatatag gaaatccttg tatatatact ttattggtcc ctaggcttcc 180 tattttgtta ccttgctttc tctatggcat ccaccatttt gattgttcta cttttatgat 240 atgttttcat aagtggttaa gcaagtattc tcgttacttt tgctcttaaa tccctattca 300 ttacagcaat gttggtggtc aaagaaaatg ataaacaact tgaatgttca atggtcctga 360 aatacataac aacattttag tacattgtaa agtagaatcc tctgttcata atgaacaaga 420 tgaaccaatg tggattagaa agaagtcega gatattaatt ccaaaatatc cagacattgt 480 taaagggaaa aaattgcaat aaaatatttg taacataaaa aaaaaaaaaa aaaaaaaaaa 540
<210>5 <211> 2508 <212> ADN <213> Homo sapiens
<400>5
5
10
agctctcccc accaataaaa ggaccaggga ggatcagaga gagcagaagg atcctgagcc 60 tcgcactctg ccgcccgcac caccttccgc tgcctctcag actctgctca gcctcacacg 120 atgtcgtgcc gctcctacag gatcagctca ggatgcgggg tcaccaggaa cttcagctcc 180 tgctcagctg tggcccccaa aactggcaac cgctgctgca tcagcgccgc cccctaccga 240 ggggtgtcct gctaccgagg gctgacgggc ttcggcagcc gcagcctctg caacctgggc 300 toctgcgggc cccggatagc tgtaggtggc ttccgagccg gctcctgcgg acgcagcttc 360 ggctaccgct ccgggggcgt gtgcggaccc agccccccat gcatcactac cgtgtcggtc 420 aacgagagcc tcctcacgcc cctcaacctg gagatcgacc ccaacgcaca gtgcgtgaag 480 caggaggaga aggagcagat caagtccctc aacagcaggt tcgcggcctt catcgacaag 540 gtgcgcttcc tggagcagca gaacaagctg ctggagacca agtggcagtt ctaccagaac 600 cagcgctgct gcgagagcaa cctggagcca ctgttcagtg gctacatcga gactctgcgg 660 cgggaggccg agtgcgtgga ggccgacagc gggaggctgg ccteagagct caaccatgtg 720 caggaggtgc tggagggcta caagaagaag tatgaagagg aggtggccct gagagccaca 780 gcagagaatg agtttgtcgt tctaaagaag gacgtggact gtgcctacct gcggaaatca 840 gacctggagg ccaatgtgga ggccctggtg gaggagtcta gcttcctgag gcgcctctat 900 gaagaggaga tccgcgttct ccaagcccac atctcagaca cctcggtcat agtcaagatg 960 gacaacagcc gagacctgaa catggactgc atcatcgctg agatcaaggc tcagtatgac 1020 gatgttgcca gccgcagccg ggccgaggct gagtcctggt accgtagcaa gtgtgaggag 1080 atgaaggcca cggtgatcag gcatggggag accctgcgcc gcaccaagga ggagatcaac 1140 gagctgaacc gcatgatcca gaggctgacg gccgagattg agaatgccaa gtgccagcgt 1200 gccaagctgg aggctgctgt ggctgaggca gagcagcagg gtgaggcggc cctcagcgat 1260 gcccgctgca agctggctga gctggagggc gccctgcaga aggccaagca ggacatggcc 1320 tgcctgctca aggagtacca ggaggtgatg aactccaagc tgggcctgga catcgagatc 1380 gccacctaca ggcgcctgct ggagggcgag gaacacaggc tgtgtgaagg tgtgggctct 1440 gtgaatgtct gtgtcagcag ctcccgtggt ggagtctcct gtgggggcct ctcctacagc 1500 accaccccag ggcgccagat cacttctggc ccctcagcca taggcggcag catcacggtg 1560 gtggcccctg actcctgtgc cccctgccag cctcgttcct ccagcttcag ctgcgggagt 1620 agccggtcgg tccgctttgc ctagtagagt catggagcca gggcttcctg ccaagcacct 1680 gcctgcctgc atcactgcac tgaatggcat gtgaatggaa aatgtgtgct tgcttccaga 1740 atcttctgga tgttcctaca gagggaaaga cctacagagg gaaagaccct cgggccgctc 1800 ccctgcgccí tttcatgcta gggagatgca tcctagttgt cctcctggca gctgttttca 1860 gaggcattcc cagcccttca cttaactcct acttagctcc aaaatacctg tatccaattt 1920 gtattattcc cccagctctc agggacaaga ccagtccccc agcgtggtgg tcagcacgga 1980 agctccacct tctgggtgga ggcgccatcc taaccatcca gccaggccac ccacaacccg 2040 agaatcaggg agaaagtccc tccccagcag ccccctcctc ctggctggga agaatggtcc 2100 cccagcaagc acttgcctgt tcaítcccgt tcatgttttg cttctctctc agactgcctt 2160
cctgcttctg ggctaacctg ttccagccag gcícctcatgtgacctcgca gttgagaagc 2220 ccattatcgt ggggcatcct tttgcctaca gcccctggtt agggcacttt ggacaggtct 2280 tgctattcag tgaacctttg tacatttcaa agaagactcc atggctgctc cagatgcccc 2340 cttgctgggt gcaggtgggg actgtccaat gcagagctgg cgggacagag agttaagcca 2400 cttcctgggt ctccttctta tgactgtcta tgggtgcatt gccttctggg ttgíctcgat 2460 ctgtgtttca ataaatgccg ctgcaatgca aaaaaaaaaa aaaaaaaa 2508
<210>6 <211> 1354 <212> ADN <213> Homo sapiens
<220>
<221> misc_feature <222> (57)..(57) <223> a o g o c o t/u
5
10
caatcagtga aaattctata ttcctttggc atttttgtga catattcaat tcagttntat 60 gttccagcag agatcattat ccctgggatc acatccaaat ttcatactaa atggaagcaa 120 atctgtgaat ttgggataag atccttcttg gttagtatta cttgcgccgg agcaatgtct 180 tattcctcgt ttagacattg tgatttcctt cgttggagct gtgagcagca gcacattggc 240 cctaatcctg ccacctttgg ttgaaattct tacattttcg aaggaacatt ataatatatg 300 gatggtcctg aaaaatattt ctaíagcatt cactggagtt gttggcttct tattaggtac 360 atatataact gttgaagaaa ttatttatcc tactcccaaa gttgtagctg gcactccaca 420 gagtcctttt ctaaatttga attcaacatg cttaacatct ggtttgaaat agtaaaagca 480 gaatcatgag tcttctattt ttgtcccatt tctgaaaatt atcaagataa ctagtaaaat 540 acattgctat atacataaaa atggtaacaa actctgtttt ctttggoacg atattaatat 600 tttggaagta atcataactc tttaccagta gtggtaaacc tatgaaaaat ccttgctttt 660 aagtgttagc aatagttcaa aaaattaagt tctgaaaatt gaaaaaatta aaatgtaaaa 720 aaattaaaga ataaaaatac ttctattatt cttttatctc agtaagaaat accttaacca 780 agatatctct cttttatgct actcttttgc cactcacttg agaacagaat aggatttcaa 840 caataagaga ataaaataag aacatgtata acaaaaagct ctctecagat catccctgtg 900 aatgccaaag taaactttat gtacagtgta aaaaaaaaaa aatctcagtt atgtttttat 960 tagccaaatt ctaatgattg gctcctggaa gtatagaaaa ctcccattaa cataatataa 1020 gcatcagaaa attgcaaaca ctagaattaa ttttacactc taatggtagt tgatcttcat 1080 agtcaagagg cactgttcaa gatcatgact tagtgtttca atgaaatttg aaaagggact 1140 ttaaaactta tccagtgcaa ctcccttgtt tttcgtcaga ggaaaaggag gcctagaaag 1200 gttaagtaac ttggtcgaga ccactcagcc ttgagatcaa gaaaacctaa tcttctgact 1260 cccaggccag gatgttttat ttctcacatc atgtccaaga aaaagaataa attatgttca 1320 gcttaaaaaa aaaaaaaaaa aaaaaaaaaa aaaa 1354
<210>7 <211> 2460 <212> ADN <213> Homo sapiens
<400> 7
cggaggcggc gccgacgggg actgctgagg cgcgcagagg gtcggcggcg cccgggagcc 60 tgtcgctggc gcggtccggg cgggaggcto ggcggcgggc ggcagcatgt cggtggcggg 120 gctgaagaag cagttctaca aggcgagcca gctggtcagt gagaaggtcg gaggggccga 180 ggggaccaag ctggatgatg acttcaaaga gatggagaag aaggtggatg tcaccagcaa 240 ggcggtgaca gaagtgctgg ccaggaccat cgagtacctg cagcccaacc cagcctcgcg 300 ggctaagctg accatgctca acacggtgtc caagatccgg ggccaggtga agaaccccgg 360 ctacccgcag tcggaggggc ttctgggcga gtgcatgatc cgccacggga aggagctggg 420
cggcgagtqc aactttggtg acgqattgct ggatgccggc gagtccatga agcgcctggc 480 agaggtgaag gactccctgg acatcgaggt caagcagaac ttcattgacc ccctccagaa 540 cctgtgcgag aaagacctga aggagatcca gcaccacctg aagaaactgg agggccgccg 600 cctggacttt gactacaaga agaagcggca gggcaagatc cccgatgagg agctacgcca 660 ggcgctggag aagttcgagg agtccaagga ggtggcagaa accagcatgc acaacctcct 720 ggagactgac atcgagcagg tgagtcagct ctcggccctg gtggatgcac agctggacta 780 ccaccggcag gccgtgcaga tectggacga gctggcggag aagctcaagc gcaggatgcg 840 ggaagcttcc tcacgcccta agcgggagta taagccgaag ccccgggagc cctttgacct 900 tggagagcct gagcagtcca acgggggctt cccctgcacc acagccccca agatcgcagc 960 ttcatcgtct ttccgatctt ccgacaagcc catccggacc cctagccgga gcatgccgcc 1020 cctggaccag ccgagctgca aggcgctgta cgacttcgag cccgagaacg acggggagct 1080 gggcttccat gagggcgacg tcatcacgct gaccaaccag atcgatgaga actggtacga 1140 gggcatgctg gacggccagt cgggcttctt cccgctcagc tacgtggagg tgcttgtgcc 1200 cctgccgcag tgactcaccc gtgtccccgc cccgccectc cgtccacact ggccggcacc 1260 ccctgctggg tctcctgcat tccacggagc ccctgctgcc agggcggtgt ctgagcctgc 1320 cggcgccacc tgggccccgg cccttgaggt actccctgag caggacccca cacttgggtg 1380 ggggggctta tctgggtggg tggggatgcc tgtttacact agcgctgact cccaacggtg 1440 acggctccct tccccactcc atggcgccag cctcctcccc cgctccccaa cttctcgccc 1500 agctggccga ggcggggcaa cactaaggtg ctcttagaaa cactaatgtt cctctggggc 1560 agcccccacc tccgtcctga cccgacgggg gcccggccca ctgcctaccc tcgagtcccg 1620 cagccttaac aggatgggat cgagggtccc catggggtgg ctcagagata ggaccctggt 1680 tttaaatccc tcccagcctg gtgctggtga tgggccctgg ccctactcca gggccaatgc 1740 acccccgcct cacacacgca ctccttctcc tcaaggccag ggcagagggc ctcaccgcct 1800 cccgggcctg ctgtcagctt gcagcccggg gacagaggcc agctgggatc tgcctgagga 1860 cagagaacat ggtctcctgc agggccctgc ctcccaagcc ccgccctcag aaagccaagt 1920 accttttcag ctttttaact gcccccatcc caacccaggg aggcctgtgt cactctggca 1980 caagctgcca ccaccagcca cccacaccca ccccagcaca cctcacacgg gaccacagcc 2040 gcgctgccga gggccaagca caaaggttcc agtgagcgca tgtcccagcc cctggtggcc 2100 aggctcccct tgctgagccg ctgccacttc accctgtggg aagtggcccc agccatctcc 2160 tctagaccaa ggcaggcagc cccgacatct gcttcctcta tcgcccaatg caaaatcgat 2220 gaaatgggga gttctctggg ccaggccaca ttcacattcc cctccccctg tggtccagtg 2280 aagcctccgg accccaggct ctgctctgcc ctgccctgca cccccctcgt cagaagtaca 2340 tgaggggcgc agagatgagc acacagcttt gggcacggtc cagggcaaac tgaaatgtac 2400 gcctgaattt tgtaaacaga agtatíaaat gtctctttct acaaaaaaaa aaaaaaaaaa 2460
<210>8 <211> 1112 5 <212>ADN
<213> Homo sapiens
<400>8
ggcacgaggg aggtgcagag ctgagaatga ggcgatttcg gaggatggag aaatagcccc 60 gagtcccgtg gaaaatgagg ccggcggact tgctgcagct ggtgctgctg ctcgacctgc 120 ccagggacct gggcggaatg gggtgttcgt ctccaccctg cgagtgccat caggaggagg 180 acttcagagt cacctgcaag gatattcaac gcatccccag cttaccgccc agtacgcaga 240 ctctgaagct tattgagact cacctgagaa ctattccaag tcatgcattt tctaatctgc 300 ccaatatttc cagaatctac gtatctatag atgtgactct gcagcagctg gaatcacact 360 ccttctacaa tttgagtaaa gtgactcaca tagaaattcg gaataccagg aacttaactt 420 acatagaccc tgatgccctc aaagagctcc ccctcctaaa gttccttggc attttcaaca 480 ctggacttaa aatgttccct gacctgacca aagtttattc cactgatata ttctttatac 540 ttgaaattac agacaaccct tacatgacgt caatccctgt gaatgctttt cagggactat 600 gcaatgaaac cttgacactg aagctgtaca acaatggctt tacttcagtc caaggatatg 660 ctttcaatgg gacaaagctg gatgctgttt acctaaacaa gaataaatac ctgacagtta 720 ttgacaaaga tgcatttgga ggagtataca gtggaccaag cttgctgctg cctcttggaa 780 gaaagtcctt gtcctttgag actcagaagg ccccaagctc cagtatgcca tcatgatgcc 840
tgctaaggca gccaccttgg tgtacatgct cacagaggct ctgttcatgg agcagctgct 900 gtttgaaaaa ttttgaaatg caagatccac aactagatgg aaggcactct agtctttgca 960 gaaaaaaaíg tacctgaatg tacattgcac aatgcctggc acaaagaagg aagaatataa 1020 atgatagttc gactcgtctg tggaagaact tacaatcatg gggaaagatg gaataaaaac 1080 attttttaaa cagcaaaaaa aaaaaaaaaa aa 1112
5
10
15
<210>9 <211> 478 <212> ADN <213> Homo sapiens
<400>9
ccccagcccc actcacccac cctccttccc accagcctgc tctccgcagg cccactgtct 60 ttgggtttaa tgacgtctct tctctgtgga acttcacgat tccttcccac ggtcaactcg 120 ggacctccca gcgaccactg cagcctgcgg acgaggccgg gacttggccg agcggatcct 180 aataagggga aaatggtaaa tgcaaacgtc ccgttacaat tttaccgcca gtgtgctgtc 240 gttccccctc cccctctccg agtcctcgtg gggacacggc ggggtctgta ggaagttggg 300 ccgggttggg ggttgctaga aggcgctggt gttttgctct gagttttaag agatcccttc 360 cttcctcttc ggtgaatgca ggttatttaa actttgggaa atgtactttt agtctgtcat 420 atcaaggcat gagtcactgt cíttttttgt gtgaataaat ggtttctagt acaatgga 478
<210> 10 <211> 845 <212> ADN <213> Homo sapiens
<400> 10
5
10
gcggccgccc gcacgtccgc gggtcccggc cgcgccgccg ccgcgcgccc ctgcccgaga 60 gagctctggc cccgctagcg gggccaggag ccgggcctcc caccgcagcg tcccccgccg 120 cgccagtccc cgctagtggt agtatctcgt aatagcttct gtgtgtgagc taccgtggat 180 ctccttccct tctcttgggg gccgggggga aagaaaagga tttaagcaaa ggctccctcg 240 ccctgtgagg gcgagcggca aaggcccggc tgagcccccc atgcccctcc cctccccgtg 300 taaaaagcct ccttgtgcaa ttgtcttttt tttcctttga acgtgcttct ttgtaatgac 360 caaggtaccg atttctgcta agttctccca acaacatgaa actgcctatt cacgccgtaa 420 tíctttctgt ctcccttctc tctctctctc tcgctcgctc gctctcgctc tcgctctctc 480 tcgctgcgtc ctcatttccc ctcccaatcc tctctcccct ctgcaacccc ccagctcgct 540 ggctttctct ctggcttctc tettttcctc ctccacccac cccctttggt ttgacaattt 600 tgtcttaagt gtttctcaaa agaggttact ttagttagca tgcgcgctgt gggcaattgt 660 tacaagtgtt cttaggttta ctgtgaagag aatgtattct gtatccgtga attgctttat 720 gggggggagg gagggctaat tatatatttt gttgttcctc tatactttgt tctgttgtct 780 gcgcctgaaa agggcggaag agttacaata aagtttacaa gcgagaaccc gaaaaaaaaa 840 aaaaa 845
<210> 11 <211> 1721 <212> ADN <213> Homo sapiens
<400> 11
caccagcaca gcaaacccgc cgggatcaaa gtgtaccagt cggcagcatg gctacgaaat 60 gtgggaattg tggacccggc tactccaccc ctctggaggc catgaaagga cccagggaag 120 agatcgtcta cctgccctgc atttaccgaa acacaggcac tgaggcccca gattatctgg 180 ccactgtgga tgttgacccc aagtctcccc agtattgcca ggtcatccac cggctgccca 240 tgcccaacct gaaggacgag ctgcatcact caggatggaa cacctgcagc agctgcttcg 300 gtgatagcac caagtcgcgc accaagctgg tgctgcccag tctcatctcc tctcgcatct 360 aígtggígga.cgtgggctct.gagccccggg.ccccaaagct gcacaaggtc attgagccca 420 aggacatcca tgccaagtgc gaactggcct ttctccacac cagccactgc ctggccagcg 480 gggaagtgat gatcagctcc ctgggagacg tcaagggcaa tggcaaaggg ggttttgtgc 540 tgctggatgg ggagacgttc gaggtgaagg ggacatggga gagacctggg ggtgctgcac 600 cgttgggcta tgacttctgg taccagcctc gacacaatgt catgatcagc actgagtggg 660 cagctcccaa tgtcttacga gatggcttca accccgctga tgtggaggct ggactgtacg 720 ggagccactt atatgtatgg gactggcagc gccatgagat tgtgcagacc ctgtctctaa 780 aagatgggct tattcccttg gagatccgct tcctgcacaa cccagacgct gcccaaggct 840 ttgtgggctg cgcactcagc tccaccatcc agcgcttcta caagaacgag ggaggtacat 900 ggtcagtgga gaaggtgatc caggtgcccc ccaagaaagt gaagggctgg ctgctgcccg 960 aaatgccagg cctgatcacc gacatcctgc tctccctgga cgaccgcttc ctctacttca 1020 gcaactggct gcatggggac ctgaggcagt atgacatctc tgacccacag agaccccgcc 1080 tcacaggaca gctcttcctc ggaggcagca ttgttaaggg aggccctgtg caagtgctgg 1140 aggacgagga actaaagtcc cagccagagc ccctagtggt caagggaaaa cgggtggctg 1200 gaggccctca gatgatccag ctcagcctgg atgggaagcg cctctacatc accacgtcgc 1260 tgtacagtgc ctgggacaag cagttttacc ctgatctcat cagggaaggc tctgtgatgc 1320 tgcaggttga tgtagacaca gtaaaaggag ggctgaagtt gaaccccaac ttcctggtgg 1380 acttcgggaa ggagcccctt ggcccagccc ttgcccatga gctccgctac cctgggggcg 1440 attgtagctc tgacatctgg atttgaactc caccctcatc acccacactc cctattttgg 1500 gccctcactt ccttggggac ctggcttcat totgctctct cttggcaccc gacccttggc 1560 agcatgtacc acacagccaa gctgagactg tggcaatgtg ttgagtcata tacatttact 1620 gaccactgtt gcttgttgct cactgtgctg cttttccatg agctcttgga ggcaccaaga 1680 aataaactcg taaccctgtc cttcaaaaaa aaaaaaaaaa a 1721
<210> 12 <211> 1061 <212> ADN
5
10
15
20
25
<213> Homo sapiens <400> 12
ccggagataa cttgagggct atagaggacc ggctaatact ggtcctgaat ttggcttcag 60 gcctcaccaa ccaagtggcc gtggccttgc cgtcttgccc gtcggccccc ggtgaggcct 120 ggacccctgg ggtcccggca ccaggccccg gcttccgacc ctggcagaag cccaagatct 180 ggtccctcgc ggagactgcc acaagccccg gacacccgcg ccggctcgcc tcccggcgcg 240 ggggggtctc caccgggggg caacggtcgc gcctttccgc cctgcagctc tctccgggcc 300 gccgccgccg ccgccgctca cagactggtc tcagcgccgc tgggcaagtt cccggcttgg 360 accaaccggc cgtttccagg cccaccgccc ggcccccgcc cgcacccgct ctccctgctg 420 ggctctgccc ctccgcacct gctgggactt cccggagccg cgggccaccc ggctgccgcc 480 gccgccttcg ctcggccagc ggagcccgaa ggcggaacag atcgctgtag tgccttggaa 540 gtggagaaaa agttactcaa gacagctttc catcccgtgc ccaggcggcc ccagaaccat 600 ctggacgccg ccctggtctt atcggctctc tcctcatcct agttctttaa aaaaaaacaa 660 aaaaacaaaa aaaacttttt ttaatcgttg taataattgt ataaaaaaaa tcgctctgta 720 tagttacaac ttgtaagcat gtccgtgtat aaatacctaa aagcaaaact aaacaaagaa 780 agtaagaaaa agaaataaaa ccagtcctcc tcagccctcc ccaagtcgct tctgtggcac 840 cccgcattcg ctgtgaggtt tgtttgtccg gttgattttg gggggtggag tttcagtgag 900 aataaacgtg tctgcctttg tgtgtgtgta tatatacaga gaaatgtaca tatgtgtgaa 960 ccaaattgta cgagaaagta tctatttttg gcíaaataaa tgagctgctg ccactttgac 1020 tataaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa a 1061
<210> 13 <211> 577 <212> ADN <213> Homo sapiens
<400> 13
tatgagcacc ttcacatgga tccacttgag. gaaagáaggt ggaccgaatt tgtaaacggt 60
gtgcagcaat atatatcaat tcgttcígag ataatcgcca cttacgctct ctgtggtttt 120 gccaatatcg ggtccctagg aatcgtgatc ggcggactca catccatggc tccttccaga 180 aagcgtgata tcgcctcggg ggcagtgaga gctctgattg cggggaccgt ggcctgcttc 240 atgacagcct gcatcgcagg catactctcc agcactcctg tggacatcaa ctgccatcac 300 gttttagaga atgccttcaa ctccactttc cctggaaccc caaccaaggg tgatagcttg 360 ttgccaaagt ctgttgagca gccctgttgc ccagggtcct ggtgaagtca tcccaggagg 420 aaaccccagt ctgtattctt tgaagggctg ctgcacattg ttgaatccat cgacctttag 480 ctgcaatggg atctctaata cattttgagg tcagccactt ctccagtgga actctgaagt 540 acagatgctg aattttctgc tttggaaaga aaaaaaa 577
<210> 14 <211> 456 <212> ADN <213> Homo sapiens
<400> 14
actcggcatg tgatgaacac ccatagttaa gaaaccatgg agcaagaaag cttgtggaaa 60 gtctctctcc ttcctcataa gacatgcaca ctaatacaca tacacaccaa aaaattacac 120 attttaaaac tgctaagctt ggatttaact gaatcatata tcttttatoa tgttatccta 180 aaagtgagaa gacataacca agacatggaa ataaatgtga aagctggagc cgaagagtca 240 aagagctaaa aaattaagtc tagaacattc tatgaggata gtataaataa aaagaaatac 300 agtctagaca tgctgcaagg aaagaagatt ctaaagtccg tttatggagg caattccata 360 tcctttcttg aacgcacatt cagcttaccc cagagagcaa gtgaggcaat ctggcaaaag 420 attaataaag atgtaaaccc ctggaaaaaa aaaaaa 456
<210> 15
<211> 3628 <212> ADN <213> Homo sapiens
5 <400> 15
gaattcggca cgagatagtt ttcaggttaa gaaagccaga atctttgttc agccacactg 60 actgaacaga cttttagtgg ggttacctgg ctaacagcag cagcggcaac ggcagcagca 120 gcagcagcag cagcagcagc agcagcaggg ctcctgggat aactcaggca tagttcaaca 180 ctatgggtcc tcctctgaag ctcttcaaaa accagaaata ccaggaactg aagcaggaat 240 gcatcaaaga cagcagactt ttctgtgatc caacatttct gcctgagaat gattctcttt 300 tctacttccg actgcttcct ggaaaggtgg tgtggaaacg tccccaggaq atctgtgatg 360 acccccatct gattgtgggc aacattagoa accaccagct gacccaaggg agactggggc 420 acaagccaat ggtttctgca ttttcctgtt tggctgttca ggagtctcat tggacaaaga 480 caattcccaa ccataaggaa caggaatggg accctcaaaa aacagaaaaa tacgctggga 540 tatttcactt tcgtttctgg cattttggag aatggactga agtggtgatt gatgacttgt 600 tgcccaccat taacggagat ctggtcttct ctttctccac ttccatgaat gagttttgga 660 atgctctgct ggaaaaagct tatgcaaagc tgctaggctg ttatgaggcc ctggatggtt 720 tgaccatcac tgatattatt gtggacttca cgggcacatt ggctgaaact gttgacatgc 780 agaaaggaag atacactgag cttgttgagg agaagtacaa gctattcgga gaactgtaca 840 aaacatttac caaaggtggt ctgatctgct gttccattga gtctcccaat caggaggagc 900 aagaagttga aactgattgg ggtctgctga agggccatac ctataccatg actgatattc 960 gcaaaattcg tcttggagag agacttgtgg aagtcttcag tgctgagaag gtgtatatgg 1020 ttcgcctgag aaaccccttg ggaagacagg aatggagtgg cccctggagt gaaatttctg 1080 aagagtggca gcaactgact gcatcagatc gcaagaacct ggggcttgtt atgtctgatg 1140 atggagagtt ttggatgagc ttggaggact tttgccgcaa ctttcacaaa ctgaatgtct 1200 gccgcaatgt gaacaaccct atttttggcc gaaaggagct ggaatcggtg ttgggatgct 1260 ggactgtgga tgatgatccc ctgatgaacc gcteaggagg ctgctataac aaccgtgata 1320 ccttcctgca gaatccccag tacatcttca ctgtgcctga ggatgggcac aaggtcatta 1380
tgícactgca gcagaaggac ctgcgcactt accgcegaat gggaagacct gacaattaca 1440 tcattggctt tgagctcttc aaggtggaga tgaaccgcaa attccgccíc caccacctct 1500 acatccagga gcgtgctggg acttccacct atattgacac ccgcacagtg tttctgagca 1560 agtacctgaa gaagggcaac tatgtgcttg tcccaaccat gttccagcat ggtcgcacca 1620 gcgagtttct cctgagaatc ttctctgaag tgcctgtcca gctcagggaa ctgactctgg 1680 acatgcccaa aatgtcctgc tggaacctgg ctcgtggcta cccgaaagta gttactcaga 1740 tcactgttca cagtgctgag gacctggaga agaagtatgc caatgaaact gtaaacccat 1800 atttggtcat caaatgtgga aaggaggaag tccgttctcc tgtccagaag aatacagttc 1860 atgccatttt tgacacccag gccattttct acagaaggac cactgacatt cctattatag 1920 tacaggtctg gaacagccga aaattctgtg atcagttctt ggggcaggtt actctggatg 1980 ctgaccccag cgactgccgí gatctgaagt ctctgtacct gcgtaagaag ggtggtccaa 2040 ctgccaaagt caagcaaggc cacatcagct tcaaggttat ttccagcgat gatctcactg 2100 agctctaaat ctgcaatccc agagaatcct gacaaagcgt gccacccttt tattttccgt 2160 caggtgccag gtcttagtta agattcacaa tctttagaaa gaatgagatt cacaataatt 2220 aactettcct ctcttctgat aaattcccca tacctcccaa tccaagtagc atctgtagct 2280 acataaccta tatacctcca gcagctggac atggggagcg acagtcctat ctagacatca 2340 tacacatttg ccaagaaagg atctctgggg cttccggggg tgagattcaa gcaggacaat 2400 aacaagaggc tggacaccct acagatgtct ttgatgtttt cagttgtttg atatatctcc 2460 cctgtagggc atgttgagga aggaggaggg ctgatcaagg ccaagctggt ctagcctgac 2520 atcctagctc ctgactgaac actatagact tcccagcagc attttcaccc agcagccaga 2580 gccggcttta agtccccaac ccttacagac accactgcca ccaccaccaa ccacgaccac 2640 caccaccacc accactcacc accatcatca cctccggaaa gtgtagtcct gccctaaccc 2700 taaccccaag tcacccccca cagtaaattt taccttcatg ttgagaaagc ttcctggtgc 2760 ttaatcaaga gctggagttc aatgagtcct agacagtgag aggggcctga gcttcagctc 2820 aatggaagcc tgctgtgtgc tcacaagacg gaaaagtgga agaagctgca gtgggagaca 2880 aagcctcggt cccccaccca tccacacaca cctacactca cacacgcgca catgggcgcg 2940 caacggaact accatttcag gcagtcagtg ggcaagagga aagataagta agtaccatac 3000 acaccttaaa agatgaggag aattcatcca gacatattac agccagtttg gggcccctga 3060 cttgcaatgt gaaacctctt cgcttgctgc taggtttaca aacaagccca ttgttcctgt 3120 gcctcctaat attcatttgt tactgaagga ccccatctgg ggacttgaga ctttggtccc 3180 agcccagacg cctcagactg gtctcaaagt caagcaaggc ttcacatcag ctgcaagtgt 3240 tagtttgcca gcgcatgatc tcactgagct tctacagaat ctgcaatccc agagtcaatc 3300 atgacgaaat gtacgtccca ccatcttaac ctatcaactt tctgcccctc cttcaaggcc 3360 cagtataaat gccacctcct ccatgaagcc ttccctaatt ccaccccaaa cccccacctt 3420 caacaatatt tcaacgcttc tgcaatgatg aaaaagaaac atagttgtag tacttagcct 3480 acctagacca gcaagcattc atttttagct cgctcatttt ttaccatgtt ttccagtctg 3540 tttaacttct gcagtgcctt cactacactg ccttacataa accaaatcac aataaagttc 3600 atattcagta caattaaaaa aaaaaaaa 3628
<210> 16 <211> 1580 5 <212> ADN
<213> Homo sapiens
<400> 16
5
10
15
tatgcaagtg tttaacagat gcttcactat taaaatattt tccccccaag tctcaaatat 60 tgaagaatct ctaaccaggg acaccagtcc ctacgaagac cttgggcgat tttgaagtgc 120 gggcacctcg attccccgaa tctgtagtgt ggctggtatc ggtgttcccc tggtttaact 180 agcctgtttg aaggcacaga tcattcatgg ggaagtataa ccgaatccag tcctctccac 240 cgcctgggga tcttcacttt cgcagtctac gactgcctgt gactccagaa agacaaactg 300 cagattggcc aagatgggga aattgaggca gagaagccaa gacatgtgct aaaggtcatg 360 caggctatga atggagctgg aatgtgaacg caggccatat gaccccagag cccatgttct 420 tgaaccctta gaaagacagc agcaacacac ctggtgcagc agctgcttag ttggagtggc 480 tgacaaggag agaatgattt ccaggaagag cggaacacat atggaaggcc ttagcttatc 540 tttagcgcct catacacccg ttctggactt cagaaaggcc agtgagtggg attaggcctc 600
agagatagga tgtcagtccc agtgagggat ggcctagagc attctttaat tctttccttt 660 gggtcacaca taagaaacaa ttttccagca ctgatgagtg ttattaacaa tgagatggga 720 tagaatttag ttttecctat ggctgtgctt caaaaataga aaagctgtct tttctctgga 780 atgattgaat gaagctctgg ggaggaaaag gtggattggc agatctctta aaggaagctt 840 ctccttctag gcactattct aaggcttaat attttaactc cctatattaa cctagttcaa 900 ctaaacagtg atctgagtaa ttttattttt attaaagctc agatcaaaat gccattaaca 960 ttgattgaga aaatcaaagg aatctttgat gtgagtggtt aaattgctga attatttcag 1020 tcccataccc tcacagcatg agtacctgat ctgatagact tctttggaat tccttttttg 1080 tttgagacag agtcttgctc tgtcgcccag gctggagtgc agcggtgtga tctcaaccat 1140 tgcaacctcc acctcccagg ttcaggtgat tctcatgcct cagcctcctg agtagctggg 1200 attacagatg tgcaccacca tgcccggcta attattttgt atctttagta gagatgaagt 1260 tttgccatgt gggccaggct gttctcaaac tactggcctc aagtgatctg cccgcctcgg 1320 cctcccagac tgctgggatt acaggcgtga ggcaccgtgc ctggctggga ttccataata 1380 aatccctctg tgtctatttc ttttttcaaa tataattttc ttcatttcca aacatcatct 1440 ttaagactcc aaggattttt ccaggcacag tggctcatac ctgtaatccc attgcttgga 1500 gaggccaagg tggaagttca tttgaggcca ggagttcgag accaggtggg caacatagtg 1560 aaaccttgtc tctacaacat 1580
<210> 17 <211> 809 <212> ADN <213> Homo sapiens
<400> 17
tgtttatata actgtgttcg tttttgttgt tccgtcccgt cgtccttgta gactctcatc 60 ctcgtgtgtt ttggaccctc caggggtgac atcgggtctt gtgttcagct ctcctggact 120 gttattcctt gtccgcgtgt tcgtgttaga cattgtccac gatctgtatc atgcctatgt 180 ctcactttgg tctcttattt cagcgtgaac actatagttc caagtttgtt cggataattc 240 tgattcttgt caccagcgtg agatttcaac agaacttgtt tggaacaaat actcacttaa 300 aacttcagca gaagaaaaat tacttagtcc ttaggccaac caatttaact gcagtgtcat 360 gtttcacagg ccttcctaca tttagaaatc gtcacacagc tgtgataaga gtagattatt 420 ttactatgaa ataattctga atagatgaaa gcataaaatg tgagaaactg aatgtattat 480 tcaggaagaa tactgagtgc ctteatttaa ctaaagttga atgtaaaagt caatttgcac 540 ttctttataa tcctctggtt tagaattata aattgttaaa accttgataa ttgtcattta 600 attatatttc aggtgtcctg aacaggtcac tagactctac attgggcagc ctttaaatat 660 gattctttgt aatgctaaat agcctttttt tctcttttta ctgcaactta atatttetat 720 ttagaacaca gaaaatgaaa atatttagaa taagttgtac atttgatgac aaataaatca 780 ctattaaaat aaaaaaaaaa aaaaaaaaa 809
<210> 18 <211> 488 <212> ADN <213> Homo sapiens
5
10
15
20
25
<220>
<221> misc_feature <222> (95)..(95)
<223> a o g o c o t/u
<400> 18
aggaacccct gtgggaaagg tttaaaccta aaacagtgcc ccctttggct cctcctccct 60 tggeggaatg ggttcctgga ccatgtgcat ttcantgggc catgggattt acatttcctt 120 gcatccccag gtggtttgat ccctgccagg gccccttcct tcctgctcat ggttttcagg 180 gggcctgatc atggaaagta agggggttgg gccttccctt ttgggggtga accctgactc . 240 catcccccta ttgcccccct aaccaatcat gcaaactttt ccccccctgg ggtaattcac 300
cagttaaaaa aagctttttt taaatgtttt gttttggggg gggggcaggg cccccttttt 360 gtttttttaa ggagttggtt ttggtttttg gctgatgttt tgttttttaa catgccccca 420 gtttgtaagg ccaaaggtaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 480 aaaaaaaa 488
<210> 19 <211> 463 <212> ADN <213> Homo sapiens
<400> 19
taagctttaa aggctctgtg ttagggcata gtctagaaac atggggccca agggcaccgg 60 gaaaacttac aaagggaaga gatggaactg ggagggttea agctaccagt tccatctctc 120 catgttttag agaattgggg cactaagtca gccaggtaag gtcaggtcag aggagggccc 180 ggatgaagca tgagatgcag agggacagtg cgtgaatgga gaccttgggt agcaccaacg 240 tgtagcggca gaggtggggt ggatgtggct gatgtcaggg agagaatggg gagcatgcac 300 agggctcagt cttatacata cattgaaaat cctttagcct ttcaaagatt attaacccaa 360 atcacctttc ttgcttactc cagatgcctc agcctctgat ataattgcta agtatctgcc 420 gtgttaaaaa taaacatttg agaatcaaaa aaaaaaaaaa aaa 463
<210> 20 <211> 2148 <212> ADN <213> Homo sapiens
<400> 20
5
10
15
gcttcagggt acagctcccc cgcagccaga agccgggcct gcagcgcctc agcaccgctc 60 cgggacaccc cacccgcttc ccaggcgtga cctgtcaaca gcaacttcgc ggtgtggtga 120 actctctgag gaaaaaccat tttgattatt actctcagac gtgcgtggca acaagtgact 180 gagacctaga aatccaagcg ttggaggtcc tgaggccagc ctaagtcgct tcaaaatgga 240 acgaaggcgt ttgtggggtt ccattcagag ccgatacatc agcatgagtg tgtggacaag 300 cccacggaga cttgtggagc tggcagggca gagcctgctg aaggatgagg ccctggccat 360 tgccgccctg gagttgctgc ccagggagct cttcccgcca ctcttcatgg cagcctttga 420 cgggagacac agccagaccc tgaaggcaat ggtgcaggcc tggcccttca cctgcctccc 480 tctgggagtg ctgatgaagg gacaacatct tcacctggag accttcaaag ctgtgcttga 540 tggacttgat gtgctccttg cccaggaggt tcgccccagg aggtggaaac ttcaagtgct 600 ggatttacgg aagaactctc atcaggactt ctggactgta tggtctggaa acagggccag 660 tctgtactca tttccagagc cagaagcagc tcagcccatg acaaagaagc gaaaagtaga 720 tggtttgagc acagaggcag agcagccctt cattccagta gaggtgctcg tagacctgtt 780 cctcaaggaa ggtgcctgtg atgaattgtt ctcctacctc attgágaaag tgaagcgaaa 840 gaaaaatgta ctacgcctgt gctgtaagaa gctgaagatt tttgcaatgc ccatgcagga 900 tatcaagatg atcctgaaaa tggtgcagct ggactctatt gaagatttgg aagtgacttg 960 tacctggaag ctacccacct tggcgaaatt ttctccttac ctgggccaga tgattaatct 1020 gcgtagactc ctcctctccc acatccatgc atcttcctac atttccccgg agaaggaaga 1080 gcagtatatc gcccagttca cctctcagtt cctcagtctg cagtgcctgc aggctctcta 1140 tgtggactct ttatttttcc ttagaggccg cctggatcag ttgctcaggc acgtgatgaa 1200 ccccttggaa accctctcaa taactaactg ccggctttcg gaaggggatg tgatgcatct 1260 gtcccagagt cccagcgtca gtcagctaag tgtcctgagt ctaagtgggg tcatgctgac 1320 cgatgtaagt cccgagcccc tccaagctct gctggagaga gcctctgcca ccctccagga 1380 cctggtcttt gatgagtgtg ggatcacgga tgatcagctc cttgccctcc tgccttccct 1440 gagccactgc tcccagctta caaccttaag cttctacggg aattccatct ccatatctgc 1500 cttgcagagt ctcctgcagc acctcatcgg gctgagcaat ctgacccacg tgctgtatcc 1560 ■tgtccccctg gagagttatg aggacatcca tggtaccctc cacctggaga ggcttgccta 1620 tctgcatgcc aggctcaggg agttgctgtg tgagttgggg cggcccagca tggtctggct 1680 tagtgccaac ccctgtcctc actgtgggga cagaaccttc tatgacccgg agcccatcct 1740
gtgcccctgt ttcatgccta actagctggg ígcacatatc aaatgcttca ttctgcatac 1800 ttggacacta aagccaggat gtgcatgcat cttgaagcaa caaagcagcc acagtttcag 1860 acaaatgttc agtgtgagtg aggaaaacat gttcagtgag gaaaaaacat tcagacaaat 1920 gttcagtgag gaaaaaaagg ggaagttggg gataggcaga tgttgacttg aggagttaat 1980 gtgatctttg gggagataca tcttatagag ttagaaatag aatctgaatt tctaaaggga 2040 gattctggct tgggaagtac atgtaggagt taatccctgt gtagactgtt gtaaagaaac 2100 tgttgaaaat aaagagaagc aatgtgaagc aaaaaaaaaa aaaaaaaa 2148
<210> 21 <211> 707 <212> ADN <213> Homo sapiens
<220>
<221> misc_feature <222> (17)..(17) <223> a o g o c o t/u
<220>
<221> misc_feature <222> (83)..(83) <223> a o g o c o t/u
<400> 21
5
10
aacacagccc taccaancaa tgatgaccag tggaaaacaa tgaagtcacc aaaccctgga 60 cagggctcat gctccaggac aanttgctgt ggcgtaaatg gtccatcaga ctggcaaaaa 120 tacacatctg ccttccggac tgagaataat gatgctgact atccctggcc tcgtcaatgc 180 tgtgttatga acaatcttaa agaacctctc aacctggagg cttgtaaact aggcgtgcct 240 ggtttttatc acaatcaggg ctgctatgaa ctgatctctg gtccaatgaa ccgacacgcc 300 tggggggttg cctggtttgg atttgccatt ctctgctgga ctttttgggt tctcctgggt 360 accatgttct actggagcag aattgaatattaagcataaa gtgttgccac catacctcct 420 tccccgagtg actctggatt tggtgctgga accagctcte tcctaatatt ccacgtttgt 480 gccccacact aacgtgtgtg tcttacattg ccaagtcaga tggtacggac ttcctttagg 540 atctcaggct tctgcagttc tcatgactcc tacttttcat cctagtctag cattctgcaa 600 catttatata gactgttgaa aggagaattt gaaaaaígca taataactac ttccatccct 660 gcttattttt aatttgggaa aataaataca ttcgaaggaa aaaaaaa 707
<210> 22 <211> 2832 <212> ADN <213> Homo sapiens
<400> 22
ggcacgaggg cgaaattgag gtttcttggt attgcgcgtt tctcttcctt gctgactctc 60 cgaatggcca tggactcgtc gcttcaggcc cgcctgtttc ccggtctcgc tatcaagatc 120 caacgcagta atggtttaat tcacagtgcc aatgtaagga ctgtgaactt ggagaaatcc 180 tgtgtttcag tggaatgggc agaaggaggt gccacaaagg gcaaagagaí tgattttgat 240 gatgtggctg caataaaccc agaactctta cagcttcttc ccttacatcc gaaggacaat 300 ctgcccttgc aggaaaatgt aacaatccag aaacaaaaac ggagatccgt caacfccaaa 360 attcctgctc caaaagaaag tcttcgaagc cgctccactc gcatgtccac tgtctcagag 420 cttcgcatca cggctcagga gaatgacatg gaggtggagc tgcctgcagc tgcaaactcc 480 cgcaagcagt tttcagttcc tcctgccccc actaggcctt cctgccctgc agtggctgaa 540 ataccattga ggatggtcag cgaggagatg gaagagcaag tccattccat ccgaggcagc 600 tcttctgcaa accctgtgaa ctcagttcgg aggaaatcat gtcttgtgaa ggaagtggaa 660 aaaatgaaga acaagcgaga agagaagaag gcccagaact ctgaaatgag aatgaagaga 720
5
10
15
20
gctcaggagt atgacagtag ttttccaaac ígggaatttg cccgaatgat taaagaattt 780 cgggctactt íggaatgtca tccacttact atgactgatc ctatcgaaga gcacagaata 840 tgtgtctgtg ttaggaaacg cccactgaat aagcaagaat tggccaagaa agaaattgat 900 gtgatttcca ttcctagcaa gtgtctcctc ttggtacatg aacccaagtt gaaagtggac 960 ttaacaaagt atctggagaa ccaagcattc tgctttgact ttgcatttga tgaaacagct 1020 tcgaatgaag ttgtctacag gttcacagca aggccactgg tacagacaat ctttgaaggt 1080 ggaaaagcaa cttgttttgc atatggccag acaggaagtg gcaagacaca tactatgggc 1140 ggagacctct ctgggaaagc ccagaatgca tccaaaggga tctatgccat ggcctcccgg 1200 gacgtcttcc tcctgaagaa tcaaccctgc taccggaagt tgggcctgga agtctatgtg 1260 acattcttcg agatctacaa tgggaagctg tttgacctgc tcaacaagaa ggccaagctg 1320 cgcgtgctgg aggacggcaa gcaacaggtg caagtggtgg ggctgcagga gcatctggtt 1380 aactctgctg atgatgtcat caagatgatc gacatgggca gcgcctgcag aacctctggg 1440 cagacatttg ccaactccaa ttcctcccgc tcccacgcgt gcttccaaat tattcttcga 1500 gctaaaggga gaatgcatgg caagttctct ítggtagatc tggcagggaa tgagcgaggc 1560 gcggacactt ccagtgctga ccggcagacc cgcatggagg gcgcagaaat caacaagagt 1620 ctcttagccc tgaaggagtg catcagggcc ctgggacaga acaaggctca caccccgttc 1680 cgtgagagca agctgacaca ggtgctgagg gactccttca ttggggagaa ctctaggact 1740 tgcatgattg ccacgatctc accaggcata agctcctgtg aataíacttt aaacaccctg 1800 agatatgcag acagggtcaa ggagctgagc ccccacagtg ggcccagtgg agagcagttg 1860 attcaaatgg aaacagaaga gatggaagcc tgctctaacg gggcgctgat tccaggcaat 1920 ttatccaagg aagaggagga actgtcttcc cagatgtcca gctttaacga agccatgact 1980 cagatcaggg agctggagga gaaggctatg gaagagctca aggagatcat acagcaagga 2040 ccagactggc ttgagctctc tgagatgacc gagcagccag actatgacct ggagaccttt 2100 gtgaacaaag cggaatctgc tctggcccag caagccaagc atttctcagc cctgccagat 2160 gtcatcaagg ccttgcgcct ggccatgcag ctggaagagc aggctagcag acaaataagc 2220 agcaagaaac ggccccagtg acgactgcaa ataaaaatct gtttggtttg acacccagcc 2280 tcttccctgg ccctccccag agaactttgg gtacctggtg ggtctaggca gggtctgagc 2340 tgggacaggt tctggtaaat gccaagtatg ggggcatctg ggcccagggc agctggggag 2400 ggggtcagag tgacatggga cactcctttt ctgttcctca gttgtcgccc tcacgagagg 2460 aaggagctct tagttaccct tttgtgttgc ccttctttcc atcaagggga atgttctcag 2520 catagagctt tctccgcagc atcctgcctg cgtggactgg ctgctaatgg agagctccct 2580 ggggttgtcc tggctctggg gagagagacg gagcctttag tacagctatc tgctggctct 2640 aaaccttcta cgcctttggg ccgagcactg aatgtcttgt actttaaaaa aatgtttctg 2700 agacctcttt ctactttact gtctccctag agatcctaga ggatccctac tgttttctgt 2760 tttatgtgtt tatacattgt atgtaacaat aaagagaaaa aataaaaaaa aaaaaaaaaa 2820 aaaaaaaaaa aa 2832
<210> 23 <211> 670 <212> ADN <213> Homo sapiens
<220>
<221> misc_feature <222> (14)..(14)
<223> a o g o c o t/u
<220>
<221> misc_feature <222> (19)..(19) <223> a o g o c o t/u
<220>
<221> misc_feature <222> (37)..(37) <223> a o g o c o t/u
5
10
15
20
25
<220>
<221> misc_feature <222> (113)..(113)
<223> a o g o c o t/u
<400> 23
aícggacttc ggtnaactnt ggcaaggatt ggacagncta ggtaggctaa atgtgtgctc 60 tgtccctgtt tgcttcaaca gaggagcaag cctcagctga gaaggagggc acntggaaca 120 cctagctcct cccgtgattc cccaaaccca taacattctt ccatagggct ggaaccagtg 180 ccccgtcctg acagggatga aaagtgaacc cctcaggtca ggagaggcca gagttgaggt 240 tctgccactt cctgtccctg gggagccact caagttacca gggctaccgg ctgaaataaa 300 tcttttccgg gtagggtcaa gggcagtgtg ttccaaggca actgatgtag gccagttgcg 360 tgactccagg tttgtcctgg tactcagtgg gtccaatcac ctggcattga tcacctggca 420 ttgatcagca cccaccccac ccctgaggct tgcccagccc ccaggccctc agatccctgc 480 tcttcctgcc tttcctgccc atgtgtcacc cagcacccaa ggttcagtga cacagggtgg 540 tttggagctg gtcactgtea tagcagctgt gatttcacaa ggaagggtgc tgcaggggga 600 cctggttgat ggggagtggg aaggggaagg aataaagaga tcttcctcag gtaaaaaaaa 660 aaaaaaaaaa 670
<210> 24 <211> 964 <212> ADN <213> Homo sapiens
<400> 24
acctcgtttg ctcccagtta cttcttatct ggagcagtaa tgtagtccac ttcactcatg 60 cctaccccgc gtgtctcgtc tcctgacatg tctcacagac gctcctgaag ttaggtcatt 120 acctaaccca tagttattta ccttgaaaga tgggtctccg cacttggaaa ggtttcaaga 180 cttgatactg caataaatta tggctcttca cctgggcgcc aactgctgat caacgaaatg 240 cttgttgaat caggggcaaa cggagtacag acgtctcaag actgaaacgg ccccattgcc 300 tggtctagta gcggatctea ctcagccgca gacaagtaat cactaacccg ttttattcta 360 ttcctatctg tggatgtgta aatggctggg gggccagccc tggataggtt tttatgggaa 420 ttctttacaa taaacatagc ttgtaacttg agatctacaa atccattcat cctgattggg 480 catgaaatcc atggtcaaga ggacaagtgg aaagtgagag ggaaggtttg ctagacacct 540 tcgcttgtta tcttgtcaag atagaaaaga tagtatcatt tcacccttgc cagtaaaaac 600 ctttccatcc acccattctc agcagactcc agtattggca cagtcactca ctgccattct 660 cacactataa caagaaaaga aatgaagtgc ataagtctcc tgggaaaaga accttaaccc 720 cttctcgtgc catgactggt gatttcatga ctcataagcc cctccgtagg catcattcaa 780 gatcaatggc ccatgcatgc tgtttgcagc agtcaattga gttgaattag aattccaacc 840 atacatttta aaggtatttg tgctgtgtgt atattttgat aaaatgttgt gacttcatgg 900 caaacaggtg gatgtgtaaa aatggaataa aaaaaaaaaa agagtcaaaa aaaaaaaaaa 960 aatt 964
<210> 25 <211> 1568 <212> ADN <213> Homo sapiens
<400> 25
ggcgcccaag ccgccgccgc cagatcggtg ccgattcctg ccctgccccg accgccagcg 60 cgaccatgtc ccatcactgg gggtacggca aacacaacgg acctgagcac tggcataagg 120 acttccccat tgccaaggga gagcgccagt cccctgttga catcgacact catacagcca 180
agtatgaccc ttccctgaag cccctgtcíg tttcctatga tcaagcaact íccctgagga 240 tcctcaacaa tggtcatgct ttcaacgtgg agtttgatga ctctcaggac aaagcagtgc 300 tcaagggagg acccctggat ggcacttaca gattgattca gtttcacttt cactggggtt 360 cacttgatgg acaaggttca gagcatactg tggataaaaa gaaatatgct gcagaacttc 420 acttggttca ctggaacacc aaatatgggg attttgggaa agctgtgcag caacctgatg 480 gactggccgt tctaggtatt tttttgaagg ttggcagcgc taaaccgggc cttcagaaag 540 ttgttgatgt gctggattcc attaaaacaa agggcaagag tgctgacttc acaaactttg 600 cagctcgtgg cctccttcct gaatecctgg attactggac ctacccaggc tcactgacca 660 cccctcctct tctggaatgt gtgacctgga ttgtgctcaa ggaacccatc agcgtcagca 720 gcgagcaggt gttgaaattc cgtaaactta acttcaatgg ggagggtgaa cccgaagaac 780 tgatggtgga caactggcgc ccagctcagc cactgaagaa caggcaaatc aaagcttcct 840 tcaaataaga tggtcccata gtctgtatcc aaataatgaa tcttcgggtg tttcccttta 900 gctaagcaca gatctacctt ggtgatttgg accctggttg ctttgtgtct agttttctag 960 acccttcatc tcttacttga tagacttact aataaaatgt gaagactaga ccaattgtca 1020 tgcttgacac aactgctgtg gctggttggt gctttgttta tggtagtagt ttttctgtaa 1080 cacagaatat aggataagaa ataagaataa agtaccttga ctttgttcac agcatgtagg 1140 gtgatgagca ctcacaattg ttgactaaaa tgctgccttt aaaacatagg aaagtagaat 1200 ggttgagtgc aaatccatag cacaagataa attgagctag ttaaggcaaa tcaggtaaaa 1260 tagtcatgat tctatgtaat gtaaaccaga aaaaataaat gttcatgatt tcaagatgtt 1320 atattaaaga aaaactttaa aaattattat atatttatag caaagttatc ttaaatatga 1380 attctgttgt aatttaatga cttttgaatt acagagatat aaatgaagta ttatctgtaa 1440 aaattgttat aattagagtt gtgatacaga gtatatttcc attcagacaa tatatcataa 1500 cttaataaat attgtaíttt agatatattc tctaataaaa ttcagaattc taaaaaaaaa 1560 aaaaaaaa 1568
<210> 26 <211> 1964 5 <212> ADN
<213> Homo sapiens
<400> 26
ggcacgaggc atggaggcgc tgctgctggg cgcggggttg ctgctgggcg cttacgtgct 60 tgtctactac aacctggtga aggccccgcc gtgcggcggc atgggcaacc tgcggggccg 120 cacggccgtg gtcacgggtg agtgcggagg cgggtgagtg cgagctggcg gggcgcgcgg 180 agaggaggcc gggccggcgg tagcagcggc ccgccgggct cagctcagct cggctcccgc 240 ccgcggtccg caggcgccaa cagcggcatc ggaaagatga cggcgctgga gctggcgcgc 300 cggggagcgc gcgtggtgct ggcctgccgc agccaggagc gcggggaggc ggctgccttc 360 gacctccgcc aggagagtgg gaacaatgag gtcatcttca tggccttgga cttggccagt 420 ctggcctcgg tgcgggcctt tgccactgcc tttctgagct ctgagccacg gttggacatc 480 ctcatccaca atgccggtat cagttcctgt ggccggaccc gtgaggcgtt taacctgctg 540 cttcgggtga accatatcgg tccctttctg ctgacacatc tgctgctgcc ttgcctgaag 600 gcatgtgccc ctagccgcgt ggtggtggta gcctcagctg cccactgtcg gggacgtctt 660 gacttcaaac gcctggaccg cccagtggtg ggctggcggc aggagctgcg ggcatatgct 720 gacactaagc tggctaatgt actgtttgcc cgggagctcg ccaaccagct tgaggccact 780 ggcgtcacct gctatgcagc ccacccaggg cctgtgaact cggagctgtt cctgcgccat 840 gttcctggat ggctgcgccc acttttgcgc ccattggctt ggctggígct ccgggcacca 900 agagggggtg cccagacacc cctgtattgt gctctacaag agggcatcga gcccctcagt 960 gggagatatt ttgccaactg ccatgtggaa gaggtgcctc cagctgcccg agacgaccgg 1020 gcagcccatc ggctatggga ggccagcaag aggctggcag ggcttgggcc tggggaggat 1080 gctgaacccg atgaagaccc ccagtctgag gactcagagg ccccatctte tctaagcacc 1140 ccccaccctg aggagcccac agtttctcaa ccttacccca gccctcagag ctcaccagat 1200 ttgtctaaga tgacgcaccg aattcaggct aaagttgagc ctgagatcca gctctcctaa 1260 ccctcaggcc aggatgcítg ccatggcact tcatggtcct tgaaaacctc ggaígtgtgc 1320 gaggccatgc cctggacact gacgggtttg tgatcttgac ctccgtggtt actttctggg 1380 gccccaagct gtgccctgga catctctttt cctggttgaa ggaataatgg gtgattattt 1440
cttcctgaga gtgacagtaa ccccagatgg agagataggg gtatgctaga cactgtgctt 1500 ctcggaaatt tggatgtagt attttcaggc cccaccctta ttgattctga tcagctctgg 1560 agcagaggca gggagtttgc aatgtgatgc actgccaaca ttgagaatta gtgaactgat 1620 ccctttgcaa ccgtctagct aggtagttaa attaccccca tgttaatgaa gcggaattag 1680 gctcccgagc taagggactc gcctagggtc tcacagtgag taggaggagg gcctgggatc 1740 tgaacccaag ggtctgaggc cagggccgac tgccgtaaga tgggtgctga gaagtgagtc 1800 agggcagggc agctggtatc gaggtgcccc atgggagtaa ggggacgcct tccgggcgga 1860 tgcagggctg gggtcatctg tatctgaagc ccctcggaat aaagcgcgtt gaccgccaaa 1920 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaa 1964
<210> 27 <211> 953 5 <212> ADN
<213> Homo sapiens
<400> 27
5
10
15
agcggtggag aaaaggcaga accagagtag agattgacag tgagctgagc caatcaggct 60 gtgaatctgc agcagtgatc ccaggtcctc caattaatac taagagagtg gaccagggcc 120 cctgaggaag acagatggca gggacagcgc gccatgaccg agagatggcg atccaggcca 180 agaaaaagct caccacggcc accaacccca ttgaaagact ccgactgcag tgcctggcca 240 ggggctctgc tgggatcaaa ggacttggca gagtgtttag aattatggat gacgataata 300 atcgaaccct tgattttaaa gaatttatga aagggttaaa tgattatgct gtggtcatgg 360 aaaaagaaga ggtggaagaa cttttccgga ggtttgataa agatggaaat ggaacaatag 420 acttcaatga atttcttctc acattaagac ctccaatgtc cagagccaga aaagaggtaa 480 tcatgcaagc ttttagaaag ttagacaaga ctggagatgg tgttataaca atcgaagacc 540 ttcgtgaagt atataatgca aaacaccacc caaagtacca gaatggggaa tggagtgagg 600 aacaagtatt taggaaattt ctggataact ttgattcacc ctatgacaaa gatggattgg 660 tgacccctga ggagttcatg aactactatg caggtgtgag cgcatccatt gacactgatg 720 tgtacttcat catcatgatg agaaccgcct ggaagcttta agcacatgac ctggggacca 780 ggccctggga cagccatgtg gctccaaatg actaaatgtc agctcaaaaa ccagaatcgt 840 atttgatttc acactcatcc taatgttttt ttctgtgtca aaatattgca ttttctgggg 900 ccaaaaaaca ggcagaaata aaagacattg agtagtcaaa aaaaaaaaaa aaa 953
<210> 28 <211> 850 <212> ADN <213> Homo sapiens
<400> 28
tagagcatta aaataactat caggcagaag aatctttctt ctcgcctagg atttcagcca 60 tgcgcgcgct ctctctcttt ctctctcttt tcctctctct ccctctttct agcctggggc 120 ttgaatttgc atgtctaatt catttactca ccatatttga attggcctga acagatgtaa 180 atcgggaagg atgggaaaaa ctgcagtcat caacaatgat taatcagctg ttgcaggcag 240 tgtcttaagg agactggtag gaggaggcat ggaaaccaaa aggccgtgtg tttágaagcc 300 taattgtcac atcaagcatc attgtcccca tgcaacaacc accaccttat acatcacttc 360 ctgttttaag cagctctaaa acatagactg aagatttatt tttaatatgt tgactttatt 420 tctgagcaaa gcatcggtca tgtgtgtatt ttttcatagt cccaccttgg agcatttatg 480 tagacattgt aaataaattt tgtgcaaaaa ggactggaaa aatgaactgt atíattgcaa 540 tttttttttg taaaagtagc agtttggtat gagttggcat gcatacaaga tttactaagt 600 gggataagct aattatactt tttgttgtgg ataaacaaat gcttgttgat agcctttttc 660 tatcaagaaa ccaaggagct aattattaat aacaatcatt gcacactgag tcttagcgtt 720 tctgatggaa acagtttgga ttgtataata acgccaagcc cagttgtagt cgtttgagtg 780 cagtaatgaa atctgaatct aaaataaaaa caagattatt tttgtcaaaa aaaaaaaaaa 840 aaaaaaaaaa 850
<210> 29 <211> 4670 <212> ADN <213> Homo sapiens
<400> 29
Claims (13)
- 51015202530354045501. Un método para clasificar una muestra que contiene células que contienen células tumorales de un tipo tisular, comprendiendo dicho método,determinar los niveles de expresión de 50 o más secuencias transcritas en células de una muestra que contiene células obtenida de un sujeto humano, yclasificar la muestra que contiene células tumorales de uno o más de una pluralidad de tipos tumorales conocidos comparando los niveles de expresión de dichas secuencias en dichas células con los niveles de expresión de dichas secuencias en la pluralidad de tipos tumorales conocidos,en el que las 50 o más secuencias transcritas se seleccionan aleatoriamente,en el que dicha clasificación se realiza usando un algoritmo de clasificación basado en distancia,
- 2. El método de la reivindicación 1, donde las 50 o más secuencias transcritas no son seleccionadas en función de sus valores de correlación, o una clasificación basada en los valores de correlación, con los tipos de tejido tumoral.
- 3. El método de cualquiera de las reivindicaciones 1 o 2, donde dicha clasificación identifica la muestra que contiene células tumorales cerebrales.
- 4. El método de cualquiera de las reivindicaciones 1 o 2 en el que dicha clasificación identifica la muestra que contiene células tumorales endometriales.
- 5. El método de cualquiera de las reivindicaciones 1 o 2 en el que dicha clasificación identifica la muestra que contiene células tumorales hepáticas.
- 6. El método de cualquiera de las reivindicaciones 1 o 2 en el que dicha clasificación identifica la muestra que contiene células tumorales de pulmón (adenocarcinoma, célula grande), células tumorales de pulmón (célula pequeña) y células tumorales de pulmón (escamosas).
- 7. El método de cualquiera de las reivindicaciones 1 o 2 en el que dicha clasificación identifica la muestra que contiene células tumorales ováricas.
- 8. El método de cualquiera de las reivindicaciones 1 o 2 en el que dicha clasificación identifica la muestra que contiene células tumorales de sarcoma.
- 9. El método de cualquiera de las reivindicaciones 1 o 2 en el que dicha clasificación identifica la muestra que contiene células tumorales del estómago o células tumorales del esófago.
- 10. El método de cualquiera de las reivindicaciones 1 o 2 en el que dicha clasificación identifica la muestra que contiene células tumorales de testículo (seminoma) o células tumorales de testículo (no seminoma).
- 11. El método de cualquiera de las reivindicaciones 1 o 2 en el que dicha clasificación identifica la muestra que contiene células tumorales de tiroides (folicular), células tumorales de tiroides (papilar) o células tumorales de tiroides (medular).
- 12. El método de cualquiera de las reivindicaciones 1 o 2 en el que dicha clasificación identifica la muestra que contiene células tumorales hepatocelulares.
- 13. El método de cualquiera de las reivindicaciones 1 o 2 en el que dicha clasificación identifica la muestra que contiene células tumorales de células germinales de testículo.precisión
imagen1 precisiónimagen2 precisiónimagen3 precisiónimagen4 precisiónimagen5 precisiónimagen6 precisiónimagen7 193imagen8 8B194imagen9 DE8Aimagen10 195DE 8Bimagen11 DE 8BA8D- mesoteítoma j
- ( 5“C“ma ) ( pieí-melanoma J ( AMes-mM*
- ' osteo sarcoma \
- { tejido biando-Hposarcoma \ / .. , _ \ 1 1 1 tejido blanao-mfh 1 f tejido blando
196imagen12 DE 8Cimagen13 (3.0^
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US57708404P | 2004-06-04 | 2004-06-04 | |
US577084P | 2004-06-04 |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2682466T3 true ES2682466T3 (es) | 2018-09-20 |
Family
ID=35463477
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES10011848.8T Expired - Lifetime ES2682466T3 (es) | 2004-06-04 | 2005-06-03 | Identificación de tumores |
ES05804887.7T Expired - Lifetime ES2548514T3 (es) | 2004-06-04 | 2005-06-03 | Identificación de tumores |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES05804887.7T Expired - Lifetime ES2548514T3 (es) | 2004-06-04 | 2005-06-03 | Identificación de tumores |
Country Status (12)
Country | Link |
---|---|
US (4) | US20060094035A1 (es) |
EP (2) | EP2371969B1 (es) |
JP (2) | JP5690039B2 (es) |
KR (1) | KR20070057761A (es) |
CN (1) | CN101035909A (es) |
AU (1) | AU2005250495A1 (es) |
CA (1) | CA2569531A1 (es) |
DK (1) | DK1751313T3 (es) |
ES (2) | ES2682466T3 (es) |
IL (1) | IL179811A (es) |
MX (1) | MXPA06014116A (es) |
WO (1) | WO2005118879A2 (es) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040219565A1 (en) | 2002-10-21 | 2004-11-04 | Sakari Kauppinen | Oligonucleotides useful for detecting and analyzing nucleic acids of interest |
ES2682466T3 (es) | 2004-06-04 | 2018-09-20 | Biotheranostics, Inc. | Identificación de tumores |
US20120258442A1 (en) | 2011-04-09 | 2012-10-11 | bio Theranostics, Inc. | Determining tumor origin |
EP1838870A2 (en) * | 2004-12-29 | 2007-10-03 | Exiqon A/S | NOVEL OLIGONUCLEOTIDE COMPOSITIONS AND PROBE SEQUENCES USEFUL FOR DETECTION AND ANALYSIS OF MICRORNAS AND THEIR TARGET MRNAs |
US20070065840A1 (en) * | 2005-03-23 | 2007-03-22 | Irena Naguibneva | Novel oligonucleotide compositions and probe sequences useful for detection and analysis of microRNAS and their target mRNAS |
WO2006132982A2 (en) * | 2005-06-03 | 2006-12-14 | Aviaradx, Inc. | Normalization genes |
EP2365092A1 (en) | 2005-06-03 | 2011-09-14 | Aviaradx, Inc. | Identification of tumors and tissues |
EP1966390A1 (en) * | 2005-12-29 | 2008-09-10 | Exiqon A/S | Detection of tissue origin of cancer |
JP2007267692A (ja) * | 2006-03-31 | 2007-10-18 | Sysmex Corp | 乳がんのリンパ節転移マーカー、プライマ及びこのマーカーを用いた乳がんのリンパ節転移判定方法 |
US20100113284A1 (en) * | 2008-04-04 | 2010-05-06 | Alexander Aristarkhov | Small interfering rna (sirna) target site blocking oligos and uses thereof |
CN102421920B (zh) * | 2009-04-16 | 2015-09-30 | 加拿大国家研究委员会 | 用于肿瘤特征和标记物组鉴定,肿瘤分级的方法和用于癌的标记物组 |
BR112013026043A2 (pt) * | 2011-06-29 | 2019-02-26 | Biotheranostics Inc | determinação de origem de tumor |
CA2905620A1 (en) | 2013-03-15 | 2014-10-02 | Biotheranostics, Inc. | Neuroendocrine tumors |
CN109055562B (zh) * | 2018-10-29 | 2022-12-20 | 深圳市颐康生物科技有限公司 | 一种生物标志物、预测肾细胞癌的复发和死亡风险的方法 |
JP7679306B2 (ja) * | 2019-03-12 | 2025-05-19 | クラウン バイオサイエンス (スーチョウ) インコーポレイテッド | 腫瘍モデルの同定のための方法および組成物 |
Family Cites Families (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6285701B1 (en) | 1998-08-06 | 2001-09-04 | Lambda Physik Ag | Laser resonator for improving narrow band emission of an excimer laser |
CA2350502C (en) | 1998-11-13 | 2009-01-27 | Pro Duct Health, Inc. | Devices and methods to identify ductal orifices during nipple aspiration |
US6647341B1 (en) | 1999-04-09 | 2003-11-11 | Whitehead Institute For Biomedical Research | Methods for classifying samples and ascertaining previously unknown classes |
WO2001094629A2 (en) * | 2000-06-05 | 2001-12-13 | Avalon Pharmaceuticals | Cancer gene determination and therapeutic screening using signature gene sets |
US7105293B2 (en) * | 2000-09-19 | 2006-09-12 | Whitehead Institute For Biomedical Research | Genetic markers for tumors |
WO2002072828A1 (fr) | 2001-03-14 | 2002-09-19 | Dna Chip Research Inc. | Procede permettant de prevoir un cancer |
WO2002074979A2 (en) * | 2001-03-20 | 2002-09-26 | Ortho-Clinical Diagnostics, Inc. | Expression profiles and methods of use |
US20030138793A1 (en) | 2001-06-10 | 2003-07-24 | Irm Llc, A Delaware Limited Liability Company | Molecular signatures of commonly fatal carcinomas |
WO2002103320A2 (en) * | 2001-06-18 | 2002-12-27 | Rosetta Inpharmatics, Inc. | Diagnosis and prognosis of breast cancer patients |
US7504222B2 (en) * | 2001-10-31 | 2009-03-17 | Millennium Pharmaceuticals, Inc. | Compositions, kits, and methods for identification, assessment, prevention, and therapy of breast cancer |
WO2003041562A2 (en) | 2001-11-14 | 2003-05-22 | Whitehead Institute For Biomedical Research | Molecular cancer diagnosis using tumor gene expression signature |
US20040002067A1 (en) * | 2001-12-21 | 2004-01-01 | Erlander Mark G. | Breast cancer progression signatures |
JP2005519624A (ja) * | 2002-03-13 | 2005-07-07 | ジェノミック ヘルス, インコーポレイテッド | 生検腫瘍組織での遺伝子発現プロファイリング |
US20040098367A1 (en) | 2002-08-06 | 2004-05-20 | Whitehead Institute For Biomedical Research | Across platform and multiple dataset molecular classification |
AU2003298786A1 (en) * | 2002-11-26 | 2004-06-18 | Protein Design Labs, Inc. | Methods of detecting soft tissue sarcoma, compositions and methods of screening for soft tissue sarcoma modulators |
JP2006519620A (ja) * | 2003-03-04 | 2006-08-31 | アークチュラス バイオサイエンス,インコーポレイティド | 乳がんにおけるer状態の弁別特性 |
EP1608964A4 (en) | 2003-03-14 | 2009-07-15 | Peter Maccallum Cancer Inst | CREATING AN EXPRESSION PROFILE OF TUMORS |
US20050003341A1 (en) * | 2003-07-01 | 2005-01-06 | Hanan Polansky | Drug discovery assays based on the biology of atherosclerosis, cancer, and alopecia |
EP1709152A4 (en) | 2003-12-15 | 2007-11-07 | Univ California | MOLECULAR SIGNATURE OF PTEN TUMOR SUPPRESSOR |
JP2008504803A (ja) | 2004-01-09 | 2008-02-21 | ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア | 遺伝子発現の細胞型特異的パターン |
US20050272061A1 (en) | 2004-02-19 | 2005-12-08 | Seattle Genetics, Inc. | Expression profiling in non-small cell lung cancer |
ES2682466T3 (es) | 2004-06-04 | 2018-09-20 | Biotheranostics, Inc. | Identificación de tumores |
US7871774B2 (en) | 2005-01-31 | 2011-01-18 | Digital Genomics Inc. | Markers for the diagnosis of lung cancer |
EP2365092A1 (en) * | 2005-06-03 | 2011-09-14 | Aviaradx, Inc. | Identification of tumors and tissues |
WO2007137366A1 (en) | 2006-05-31 | 2007-12-06 | Telethon Institute For Child Health Research | Diagnostic and prognostic indicators of cancer |
WO2008116592A1 (en) | 2007-03-23 | 2008-10-02 | F. Hoffmann-La Roche Ag | Apex as a marker for lung cancer |
WO2008117278A2 (en) | 2007-03-27 | 2008-10-02 | Rosetta Genomics Ltd. | Gene expression signature for classification of cancers |
US20100273172A1 (en) | 2007-03-27 | 2010-10-28 | Rosetta Genomics Ltd. | Micrornas expression signature for determination of tumors origin |
WO2009057113A2 (en) | 2007-10-31 | 2009-05-07 | Rosetta Genomics Ltd. | Diagnosis and prognosis of specific cancers by means of differential detection of micro-rnas/mirnas |
WO2009153775A2 (en) | 2008-06-17 | 2009-12-23 | Rosetta Genomics Ltd. | Methods for distinguishing between specific types of lung cancers |
GB0904957D0 (en) | 2009-03-23 | 2009-05-06 | Univ Erasmus Medical Ct | Tumour gene profile |
-
2005
- 2005-06-03 ES ES10011848.8T patent/ES2682466T3/es not_active Expired - Lifetime
- 2005-06-03 CA CA002569531A patent/CA2569531A1/en not_active Abandoned
- 2005-06-03 US US11/145,307 patent/US20060094035A1/en not_active Abandoned
- 2005-06-03 CN CNA2005800263805A patent/CN101035909A/zh active Pending
- 2005-06-03 ES ES05804887.7T patent/ES2548514T3/es not_active Expired - Lifetime
- 2005-06-03 WO PCT/US2005/019736 patent/WO2005118879A2/en active Application Filing
- 2005-06-03 AU AU2005250495A patent/AU2005250495A1/en not_active Abandoned
- 2005-06-03 MX MXPA06014116A patent/MXPA06014116A/es unknown
- 2005-06-03 KR KR1020077000268A patent/KR20070057761A/ko not_active Withdrawn
- 2005-06-03 EP EP10011848.8A patent/EP2371969B1/en not_active Expired - Lifetime
- 2005-06-03 EP EP05804887.7A patent/EP1751313B1/en not_active Expired - Lifetime
- 2005-06-03 DK DK05804887.7T patent/DK1751313T3/da active
- 2005-06-03 JP JP2007515665A patent/JP5690039B2/ja not_active Expired - Lifetime
-
2006
- 2006-12-04 IL IL179811A patent/IL179811A/en active IP Right Grant
-
2012
- 2012-09-25 US US13/626,078 patent/US20130023441A1/en not_active Abandoned
-
2013
- 2013-10-04 JP JP2013209489A patent/JP5878904B2/ja not_active Expired - Lifetime
-
2016
- 2016-12-02 US US15/368,411 patent/US10538816B2/en not_active Expired - Lifetime
-
2019
- 2019-12-02 US US16/701,000 patent/US20200190597A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
JP5878904B2 (ja) | 2016-03-08 |
CN101035909A (zh) | 2007-09-12 |
MXPA06014116A (es) | 2007-08-08 |
US20060094035A1 (en) | 2006-05-04 |
EP1751313B1 (en) | 2015-07-22 |
US10538816B2 (en) | 2020-01-21 |
EP2371969A1 (en) | 2011-10-05 |
US20200190597A1 (en) | 2020-06-18 |
JP2008501345A (ja) | 2008-01-24 |
US20130023441A1 (en) | 2013-01-24 |
IL179811A (en) | 2017-10-31 |
DK1751313T3 (da) | 2015-10-26 |
IL179811A0 (en) | 2007-05-15 |
EP1751313A2 (en) | 2007-02-14 |
EP2371969B1 (en) | 2018-05-23 |
CA2569531A1 (en) | 2005-12-15 |
KR20070057761A (ko) | 2007-06-07 |
JP2014183838A (ja) | 2014-10-02 |
WO2005118879A3 (en) | 2006-04-13 |
WO2005118879A2 (en) | 2005-12-15 |
JP5690039B2 (ja) | 2015-03-25 |
ES2548514T3 (es) | 2015-10-19 |
AU2005250495A1 (en) | 2005-12-15 |
US20170268064A1 (en) | 2017-09-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2550652T3 (es) | Identificación de tumores y tejidos | |
KR102184868B1 (ko) | 카피수 변이를 판정하기 위한 dna 단편 크기의 사용 | |
ES2682466T3 (es) | Identificación de tumores | |
Duan et al. | Recent advances in detecting mitochondrial DNA heteroplasmic variations | |
CA2743473C (en) | Methods and compositions of molecular profiling for disease diagnostics | |
CN108779487A (zh) | 用于检测甲基化状态的核酸和方法 | |
CN104812947A (zh) | 检测遗传变异的系统和方法 | |
KR20150100698A (ko) | 갑상선 종양을 진단하기 위한 조성물 및 방법 | |
CN113614246A (zh) | 用于鉴别肿瘤模型的方法和组合物 | |
WO2021168455A1 (en) | Methods of spatially resolved single cell rna sequencing | |
AU2017268578A1 (en) | Methods and compositions of molecular profiling for disease diagnostics | |
EP2107127A1 (en) | In vitro diagnostic method for the diagnosis of somatic and ovarian cancers | |
Kehl et al. | Review of Molecular Technologies for Investigating Canine Cancer | |
CN113025720A (zh) | 一种用于检测原发性乳腺弥漫性大b细胞淋巴瘤的标志物及其试剂盒和应用 | |
CN113646443A (zh) | 用于诊断神经胶质瘤或预测预后的组合物以及提供其相关信息的方法 | |
WO2014190927A1 (zh) | 胰腺神经内分泌肿瘤易感基因位点及检测方法和试剂盒 | |
CN114514327A (zh) | 使用同步标志物检测评估弥漫性神经胶质瘤和对治疗的应答性 | |
EP2784165A1 (en) | A method for detecting a genetic predisposition to prostate cancer (PC) | |
US20210324476A1 (en) | Compositions and methods for identifying cancer | |
US20060286579A1 (en) | Normalization genes | |
JP5015547B2 (ja) | ドセタキセル療法の副作用を予測する方法およびキット | |
AU2020372488A1 (en) | Sample preparation and sequencing analysis for repeat expansion disorders and short read deficient targets | |
US20150167100A1 (en) | Hereditary Cancer Genes | |
Rooney | A genomic approach to the study of chemoresistance | |
CN107475435A (zh) | 人nos3基因第70位点的单核苷酸多态性及其应用 |