[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

ES2861400T3 - Evaluación de la actividad de la ruta de señalización celular de NFkB usando modelos matemáticos de la expresión de genes diana - Google Patents

Evaluación de la actividad de la ruta de señalización celular de NFkB usando modelos matemáticos de la expresión de genes diana Download PDF

Info

Publication number
ES2861400T3
ES2861400T3 ES16753888T ES16753888T ES2861400T3 ES 2861400 T3 ES2861400 T3 ES 2861400T3 ES 16753888 T ES16753888 T ES 16753888T ES 16753888 T ES16753888 T ES 16753888T ES 2861400 T3 ES2861400 T3 ES 2861400T3
Authority
ES
Spain
Prior art keywords
nfkb
signaling pathway
cell signaling
target genes
activity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES16753888T
Other languages
English (en)
Inventor
Ooijen Hendrik Jan Van
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV filed Critical Koninklijke Philips NV
Application granted granted Critical
Publication of ES2861400T3 publication Critical patent/ES2861400T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/20Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/33Heterocyclic compounds
    • A61K31/335Heterocyclic compounds having oxygen as the only ring hetero atom, e.g. fungichromin
    • A61K31/336Heterocyclic compounds having oxygen as the only ring hetero atom, e.g. fungichromin having three-membered rings, e.g. oxirane, fumagillin
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/33Heterocyclic compounds
    • A61K31/395Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins
    • A61K31/41Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins having five-membered rings with two or more ring hetero atoms, at least one of which being nitrogen, e.g. tetrazole
    • A61K31/4151,2-Diazoles
    • A61K31/4161,2-Diazoles condensed with carbocyclic ring systems, e.g. indazole
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/33Heterocyclic compounds
    • A61K31/395Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins
    • A61K31/495Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins having six-membered rings with two or more nitrogen atoms as the only ring heteroatoms, e.g. piperazine or tetrazines
    • A61K31/4985Pyrazines or piperazines ortho- or peri-condensed with heterocyclic ring systems
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/56Compounds containing cyclopenta[a]hydrophenanthrene ring systems; Derivatives thereof, e.g. steroids
    • A61K31/57Compounds containing cyclopenta[a]hydrophenanthrene ring systems; Derivatives thereof, e.g. steroids substituted in position 17 beta by a chain of two carbon atoms, e.g. pregnane or progesterone
    • A61K31/573Compounds containing cyclopenta[a]hydrophenanthrene ring systems; Derivatives thereof, e.g. steroids substituted in position 17 beta by a chain of two carbon atoms, e.g. pregnane or progesterone substituted in position 21, e.g. cortisone, dexamethasone, prednisone or aldosterone
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/04Peptides having up to 20 amino acids in a fully defined sequence; Derivatives thereof
    • A61K38/05Dipeptides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57484Immunoassay; Biospecific binding assay; Materials therefor for cancer involving compounds serving as markers for tumor, cancer, neoplasia, e.g. cellular determinants, receptors, heat shock/stress proteins, A-protein, oligosaccharides, metabolites
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • G16B5/20Probabilistic models
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/60Complex ways of combining multiple protein biomarkers for diagnosis

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Medical Informatics (AREA)
  • Medicinal Chemistry (AREA)
  • Veterinary Medicine (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Evolutionary Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Immunology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Pathology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Physiology (AREA)
  • Oncology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Hospice & Palliative Care (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Cell Biology (AREA)
  • Biomedical Technology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Artificial Intelligence (AREA)

Abstract

Un método que comprende: inferir la actividad de una ruta de señalización celular de NFkB basada al menos en los niveles de expresión de siete genes diana de la ruta de señalización celular de NFkB medidos en una muestra, en donde la inferencia comprende: determinar un nivel de un elemento de factor de transcripción (TF) NFkB en la muestra, controlando el elemento TF NFkB la transcripción de los siete genes diana de la ruta de señalización celular de NFkB, basándose la determinación al menos en parte en la evaluación de un modelo matemático que relaciona los niveles de expresión de los siete genes diana de la ruta de señalización celular de NFkB con el nivel del elemento TF NFkB, en donde los siete genes diana son CCL5, CXCL2, ICAM1, IL6, IL8, NFKBIA y TNFAIP2; inferir la actividad de la ruta de señalización celular de NFkB basada en el nivel determinado del elemento TF NFkB en la muestra, en donde la inferencia se realiza mediante un dispositivo de procesamiento digital usando el modelo matemático.

Description

DESCRIPCIÓN
Evaluación de la actividad de la ruta de señalización celular de NFkB usando modelos matemáticos de la expresión de genes diana
Campo de la invención
La presente invención se refiere en general al campo de la bioinformática, procesamiento genómico, procesamiento proteómico y técnicas relacionadas. Más particularmente, La presente invención se refiere a un método que comprende inferir la actividad de una ruta de señalización celular de NFkB basada al menos en los niveles de expresión de seis o más genes diana de la ruta de señalización celular de NFkB medidos en una muestra. La presente invención se refiere además a un aparato que comprende un procesador digital configurado para realizar un método tal, un medio de almacenamiento no transitorio que almacena instrucciones que son ejecutables por un dispositivo de procesamiento digital para realizar un método tal, y un programa informático que comprende medios de código de programa para hacer que un dispositivo de procesamiento digital realice un método tal. La presente invención se refiere además a kits para medir niveles de expresión.
Antecedentes de la invención
Los análisis genómicos y proteómicos se han realizado sustancialmente y son una promesa potencial para la aplicación clínica en campos médicos tales como la oncología, donde se sabe que diversos cánceres están asociados a combinaciones específicas de mutaciones/variaciones genómicas y/o niveles de expresión altos o bajos para genes específicos, que juegan un papel en el crecimiento y la evolución del cáncer, por ejemplo, proliferación celular y metástasis.
El factor nuclear kappa B (NFkB o NFkB) es un factor de transcripción inducible que regula la expresión de muchos genes implicados en la respuesta inmunitaria. La ruta de señalización celular de NFkB es una ruta de señalización celular clave implicada en la respuesta inmunitaria, inflamatoria y de fase aguda, pero también está implicada en el control de la supervivencia, la proliferación y la apoptosis de las células. En células sanas, no activadas, los factores de transcripción asociados a la ruta de señalización celular de NFkB que están compuestos por dímeros que se originan en cinco genes (NFKB1 o p50/p105, NFKB2 o p52/p100, RELA o p65, REL y r El B) son predominantemente citoplasmáticos debido a su interacción con los inhibidores de NFkB (IkB) y por lo tanto permanecen transcripcionalmente inactivos, manteniendo de esta manera inactiva la ruta de señalización celular de NFkB. Tras la activación de la cascada de señalización anterior, los IkB se fosforilan y se someten a degradación dependiente de ubiquitina por el proteasoma, y los dímeros de NFkB se traslocan al núcleo donde actúan como factores de transcripción. Además de esta ruta de señalización celular de NFkB canónica, también existe una ruta alternativa que es capaz de iniciar la transcripción regulada por NFkB (véase la Figura 1; RC = ruta canónica; RA = ruta alternativa; PS = proteasoma; NC = núcleo). La expresión "ruta de señalización celular de NFkB" en el presente documento se refiere preferentemente a cualquier proceso de señalización que conduce a la actividad transcripcional de los factores de transcripción de NFkB anteriormente mencionados.
Aunque se sabe que la actividad de la ruta de señalización celular de NFkB está asociada a diferentes tipos de cáncer y soporta los fenotipos de pro-supervivencia de las células cancerosas, no hay ningún ensayo clínico disponible para evaluar la actividad de la ruta de señalización celular de NFkB. Es por lo tanto deseable ser capaz de mejorar las posibilidades de caracterizar a los pacientes que tienen un cáncer, por ejemplo, un linfoma difuso de linfocitos B grandes (DLBCL), un mieloma múltiple, un cáncer de otro origen hematológico o un tumor sólido, tales como un tumor de mama, melanoma o de próstata, que esté dirigido al menos parcialmente por una actividad promotora de tumores de la ruta de señalización celular de NFkB y que, por lo tanto, es probable que responda a inhibidores de la ruta de señalización celular de NFkB.
Y. Xing, F. Zhou y J. Wang, "Subset of genes targeted by transcription factor NF-kB in TNFa-stimulated human HeLa cells", Functional and Integrative Genomics, Vol. 13, N.° 1, páginas 143 a 154 (2013) desvelan un estudio, que afirma que los genes diana directos (DTG) de NF-kB en las células HeLa estimuladas con TNFa se identificaron mediante el uso de ChIP-Seq, ARNi y técnicas de perfilado de expresión génica.
F. Feuerhake et al., "NFkB activity, function, and target-gene signatures in primary mediastinal large B-cell lymphoma and diffuse large B-cell lymphoma subtypes", Blood, Vol. 106, N.° 4, páginas 1392 a 1399 (2005) desvelan que el linfoma mediastinal de linfocitos B grandes (MLBCL) primario comparte características clínicas y moleculares con el linfoma de Hodgkin clásico, incluyendo la localización nuclear de la subunidad c-REL del factor nuclear kB (NFkB) (homólogo de oncogén vírico de reticuloendoteliosis) en una serie piloto. Los autores analizaron la localización subcelular de c-REL en MLBCL primarios adicionales y caracterizaron la actividad y función de NFkB en una línea celular MLBCL.
El documento US 2004/0180341 A1 se refiere a la regulación transcripcional de una familia de proteínas definida por la presencia de un motivo RKIP. Las proteínas que comprenden el motivo RKIP modulan las quinasas implicadas en las rutas de transducción de señales. La regulación transcripcional de proteínas que contienen un motivo RKIP forma la base para ensayos de cribado para la identificación de agentes útiles para modular las rutas de transducción de señales sujetas a la regulación mediada por la familia RKIP y para el diagnóstico y tratamiento de trastornos que implican actividades inapropiadas de rutas sujetas a regulación por la familia RKIP.
Sumario de la invención
La presente invención proporciona métodos y aparatos nuevos y mejorados como se desvela en el presente documento.
De acuerdo con un aspecto principal de la presente invención, el problema anterior se resuelve mediante un método para inferir la actividad de una ruta de señalización celular de NFkB usando modelados matemáticos de expresiones de genes diana, a saber, un método que comprende:
inferir la actividad de una ruta de señalización celular de NFkB basada al menos en los niveles de expresión de siete genes diana de la ruta de señalización celular de NFkB medidos en una muestra, en donde la inferencia comprende:
determinar un nivel de un elemento de factor de transcripción (TF) NFkB en la muestra, controlando el elemento TF NFkB la transcripción de los siete genes diana de la ruta de señalización celular de NFkB, basándose la determinación al menos en parte en la evaluación de un modelo matemático que relaciona los niveles de expresión de los siete genes diana de la ruta de señalización celular de NFkB con el nivel del elemento TF NFkB, en donde los siete genes son CCL5, CXCL2, ICAM1, IL6, IL8, NFKBIA y TNFAIP2;
inferir la actividad de la ruta de señalización celular de NFkB basada en el nivel determinado del elemento TF NFkB en la muestra,
en donde la inferencia se realiza mediante un dispositivo de procesamiento digital usando el modelo matemático.
En el presente documento, el "nivel" de un elemento TF denota el nivel de actividad del elemento TF con respecto a la transcripción de sus genes diana.
La presente invención se basa en la comprensión de los inventores de que una forma adecuada de identificar los efectos que se producen en la ruta de señalización celular de NFkB pueden basarse en una medición de la salida de señalización de la ruta de señalización celular de NFkB, que es, entre otros, la transcripción de los genes diana por un elemento del factor de transcripción (TF) de NFkB controlado por la ruta de señalización celular de NFkB. Esta comprensión de los inventores supone que el nivel de TF se encuentra en un estado cuasi-estacionario en la muestra que puede detectarse por medio de, entre otros, los valores de expresión de los genes diana. Se sabe que la ruta de señalización celular de NFkB dirigida en el presente documento está asociada a diferentes tipos de cáncer y soporta los fenotipos pro-supervivencia de las células cancerosas ya que se sabe que la ruta de señalización celular de NFkB regula los genes que controlan la proliferación celular y los procesos de supervivencia celular. Se ha descubierto que muchos tipos diferentes de tumores humanos tienen una actividad desregulada de la ruta de señalización celular de NFkB. Adicionalmente, los estudios han demostrado que la inhibición de la actividad constitutiva de la ruta de señalización celular de NFkB bloquea el potencial oncogénico de las células cancerosas.
La presente invención hace posible determinar la actividad de la ruta de señalización celular de NFkB (i) determinando un nivel de un elemento TF NFkB en la muestra, en donde la determinación se basa al menos en parte en la evaluación de un modelo matemático que relaciona los niveles de expresión de siete genes diana de la ruta de señalización celular de NFkB, cuya transcripción está controlada por el elemento TF NFkB, al nivel del elemento TF NFkB y (ii) inferir la actividad de la ruta de señalización celular de NFkB basada en el nivel determinado del elemento t F NFkB en la muestra. Esto preferentemente permite mejorar las posibilidades de caracterizar a los pacientes que tienen un cáncer, por ejemplo, un linfoma difuso de linfocitos B grandes (DLBCL), un mieloma múltiple, un cáncer de otro origen hematológico o un tumor sólido, tales como un tumor de mama, melanoma o de próstata, que esté dirigido al menos parcialmente por una actividad promotora de tumores de la ruta de señalización celular de NFkB y que, por lo tanto, es probable que responda a inhibidores de la ruta de señalización celular de NFkB. Una ventaja importante de la presente invención es que hace posible determinar la actividad de la ruta de señalización celular de NFkB usando una única muestra, en lugar de requerir una pluralidad de muestras extraídas en diferentes puntos en el tiempo.
En el presente documento, un elemento de factor de transcripción (TF) de NFkB se define como un complejo proteico que contiene al menos uno o, preferentemente, un dímero de los miembros de NFkB (NFKB1 o p50/p105, NFKB2 o p52/p100, RELA o p65, REL y RELB), que es capaz de unirse a secuencias de ADN específicas, controlando de esta manera la transcripción de genes diana.
El modelo matemático puede ser un modelo probabilístico, preferentemente un modelo de red bayesiana, basado al menos en parte en probabilidades condicionales que relacionan el elemento TF NFkB y los niveles de expresión de los siete genes diana de la ruta de señalización celular de NFkB medidos en la muestra, o el modelo matemático puede basarse al menos en parte en una o más combinación o combinaciones lineales de los niveles de expresión de los siete genes diana de la ruta de señalización celular de NFkB medidos en la muestra. En particular, la inferencia de la actividad de la ruta de señalización celular de NFkB puede realizarse como se desvela en la solicitud de patente internacional publicada WO 2013/011479 A2 ("Assessment of cellular signaling pathway activity using probabilistic modeling of target gene expression") o como se desvela en la solicitud de patente internacional publicada WO 2014/102668 A2 ("Assessment of cellular signaling pathway activity using linear combination(s) of target gene expressions"). Pueden encontrarse detalles adicionales sobre la inferencia de la actividad de la ruta de señalización celular usando modelos matemáticos de la expresión de genes diana en Verhaegh W. et al., "Selection of personalized patient therapy through the use of knowledge-based computational models that identify tumor-driving signal transduction pathways", Cancer Research, Vol. 74, N.° 11, 20l4, páginas 2936 a 2945.
Hacer uso de un modelo probabilístico, tal como un modelo de red bayesiana, permite incorporar información existente sobre la ruta de señalización celular de NFkB usando relaciones probabilísticas condicionales. Esto también incluye la incorporación de información basada en un conocimiento parcial (en lugar de comprehensivo) de la ruta de señalización celular de NFkB así como mediciones biológicas que normalmente se miden con cierta incertidumbre. Por el contrario, el uso de un modelo matemático que se basa al menos en parte en una o más combinación o combinaciones lineales de niveles de expresión puede proporcionar una manera muy sencilla y fácil de calcular para inferir la actividad de la ruta de señalización celular de NFkB.
La actividad inferida de la ruta de señalización celular de NFkB puede relacionarse con un sujeto, en particular, con un tejido y/o células y/o un fluido corporal del sujeto, en donde el término "sujeto", como se usa en el presente documento, se refiere a cualquier ser vivo, si la muestra es una muestra del sujeto. En algunas realizaciones, el sujeto es un animal, preferentemente, un mamífero. En determinadas realizaciones, el sujeto es un ser humano, preferentemente un sujeto médico. Por otro lado, si la muestra se toma, por ejemplo, de una línea celular, un cultivo de células primarias o un cultivo organoide, la actividad inferida solo puede ser representativa para el sujeto en el momento en que la muestra original de la cual la línea celular, el cultivo celular primario o el cultivo organoide derivado se extrajo del sujeto junto con los posibles efectos del tratamiento en caso de que la línea celular, el cultivo de células primarias o el cultivo de organoides se sometiera a uno o más tratamientos, por ejemplo, con fármacos, productos químicos o un tratamiento físico. Por otra parte, los "genes diana" pueden ser "genes diana directos" y/o "genes diana indirectos" (como se describe en el presente documento).
Los genes diana se seleccionaron usando una nueva metodología basada en una extensa revisión de la bibliografía realizada por los inventores que indicó que los genes diana seleccionados proporcionan una buena base para inferir la actividad de la ruta de señalización celular de NFkB, como se describe con más detalle en el Ejemplo 2. Ventajosamente, dado que se usan múltiples genes diana para inferir la actividad de la ruta de señalización celular de NFkB, puede lograrse una inferencia más robusta de la actividad de la ruta de señalización celular de NFkB.
Otro aspecto de la presente invención se refiere a un método (como se describe en el presente documento), que comprende además: determinar si la ruta de señalización celular de NFkB está funcionando de forma anormal basándose en la actividad inferida de la ruta de señalización celular de NFkB.
Al determinar si la ruta de señalización celular de NFkB está funcionando de manera anormal, por ejemplo, en pacientes que tienen un cáncer que está al menos parcialmente impulsado por una ruta de señalización celular de NFkB desregulada, estos pacientes pueden caracterizarse de una manera eficiente y fiable. En otra variante, el método (como se describe en el presente documento) puede usarse para caracterizar líneas celulares, por ejemplo, derivadas de muestras de paciente con cáncer, con o sin agentes de estimulación específicos tales como TNFa o LPS.
La presente invención también se refiere a un método (como se describe en el presente documento) que comprende además:
recomendar la prescripción de un medicamento que corrija el funcionamiento anormal de la ruta de señalización celular de NFkB,
en donde la recomendación se realiza solo si se determina que la ruta de señalización celular de NFkB está funcionando de forma anormal basándose en la actividad inferida de la ruta de señalización celular de NFkB. Al hacer esto, puede asegurarse mejor, por ejemplo, que los fármacos que se basan en inhibidores de la ruta de señalización celular de NFkB solo se recomienden a pacientes que tengan un cáncer que es probable que responda a tales inhibidores. De esa manera, puede evitarse la ingesta innecesaria de dichos medicamentos por parte de pacientes que probablemente no se beneficien de ellos, mientras que se optimizan las posibilidades de respuesta al tratamiento.
La presente invención también se refiere a un método (como se describe en el presente documento), en donde la inferencia comprende: inferir la actividad de la ruta de señalización celular de NFkB basada al menos en los niveles de expresión de siete genes diana de la ruta de señalización celular de NFkB medidos en la muestra.
Ventajosamente, dado que se usan múltiples genes diana para inferir la actividad de la ruta de señalización celular de NFkB, puede lograrse una inferencia más robusta de la actividad de la ruta de señalización celular de NFkB.
La muestra o muestras a usar de acuerdo con la presente invención pueden ser una muestra extraída, es decir, una muestra que se ha extraído del sujeto. Los ejemplos de la muestra incluyen, pero no se limitan a, un tejido, biopsia, células, sangre y/o un fluido corporal de un sujeto. Puede estar, por ejemplo, una muestra obtenida de una lesión de cáncer, o de una lesión que se sospecha de cáncer, o de un tumor metastásico, o de una cavidad corporal en la cual hay líquido contaminado con células cancerosas (por ejemplo, cavidad pleural o abdominal o cavidad vesical) o de otros fluidos corporales que contienen células cancerosas, etcétera, preferentemente mediante un procedimiento de biopsia u otro procedimiento de extracción de muestras. Las células de las que se extrae una muestra también pueden ser células tumorales de neoplasias hematológicas (tales como leucemia o linfoma). En algunos casos, la muestra de células también pueden ser células tumorales circulantes, esto es, células tumorales que han entrado en el torrente sanguíneo y pueden extraerse mediante técnicas de aislamiento adecuadas, por ejemplo, aféresis o extracción de sangre venosa convencional. Aparte de la sangre, un fluido corporal del que se extrae una muestra puede ser orina, contenido gastrointestinal o un extravasado. El término "muestra", como se usa en el presente documento, también abarca el caso en que, por ejemplo, se han tomado del sujeto un tejido y/o células y/o un fluido corporal del sujeto y, por ejemplo, se han colocado en un portaobjetos de microscopio y, para realizar el método reivindicado, se extrae una parte de esta muestra, por ejemplo, por medio de microdisección por captura láser (LCM, por sus siglas en inglés), o raspando las células de interés del portaobjetos, o mediante técnicas de clasificación de células activadas por fluorescencia. Además, el término "muestra", como se usa en el presente documento, también abarca el caso en el que, por ejemplo, se ha tomado del sujeto un tejido y/o células y/o un fluido corporal del sujeto y se ha colocado en un portaobjetos de microscopio y el método reivindicado se realiza en el portaobjetos.
De acuerdo con otro aspecto divulgado, un aparato comprende un procesador digital configurado para realizar un método de acuerdo con la presente invención como se describe en el presente documento.
De acuerdo con otro aspecto divulgado, un medio de almacenamiento no transitorio almacena instrucciones que son ejecutables por un dispositivo de procesamiento digital para realizar un método de acuerdo con la presente invención como se describe en el presente documento. El medio de almacenamiento no transitorio puede ser un medio de almacenamiento legible por ordenador, tales como un disco duro u otro medio de almacenamiento magnético, un disco óptico u otro medio de almacenamiento óptico, una memoria de acceso aleatorio (RAM, por sus siglas en inglés), una memoria de solo lectura (ROM, por sus siglas en inglés), una memoria flash u otro medio de almacenamiento electrónico, un servidor de red, etcétera. El dispositivo de procesamiento digital puede ser un dispositivo portátil (por ejemplo, un asistente de datos personales o un teléfono inteligente), un ordenador portátil, un ordenador de sobremesa, un ordenador o dispositivo de tableta, un servidor de red remoto, etcétera.
De acuerdo con otro aspecto divulgado, un programa de ordenador comprende medios de código de programa para hacer que un dispositivo de procesamiento digital realice un método de acuerdo con la presente invención como se describe en el presente documento, cuando el programa informático se ejecuta en el dispositivo de procesamiento digital. El dispositivo de procesamiento digital puede ser un dispositivo portátil (por ejemplo, un asistente de datos personales o un teléfono inteligente), un ordenador portátil, un ordenador de sobremesa, un ordenador o dispositivo de tableta, un servidor de red remoto, etcétera.
De acuerdo con otro aspecto divulgado, una señal representa una actividad inferida de una ruta de señalización celular de NFkB, en donde la actividad inferida resulta de realizar un método de acuerdo con la presente invención como se describe en el presente documento. La señal puede ser una señal digital o puede ser una señal analógica.
De acuerdo con otro aspecto divulgado, un kit para medir los niveles de expresión de siete genes diana de la ruta de señalización celular de NFkB en una muestra comprende:
cebadores de reacción en cadena de la polimerasa dirigidos a los siete genes diana de NFkB,
sondas dirigidas a los siete genes diana de NFkB, y
opcionalmente, un aparato que comprende un procesador digital configurado para realizar el método de acuerdo con la presente invención como se describe en el presente documento, un medio de almacenamiento no transitorio que almacena instrucciones que son ejecutables por un dispositivo de procesamiento digital para realizar un método de acuerdo con la presente invención como se describe en el presente documento, o un programa informático que comprende medios de código de programa para hacer que un dispositivo de procesamiento digital realice un método de acuerdo con a la presente invención como se describe en el presente documento cuando el programa informático se ejecuta en el dispositivo de procesamiento digital,
en donde los siete genes diana de NFkB son CCL5, CXCL2, ICAM1, IL6, IL8, NFKBIA y TNFAIP2.
De acuerdo con otro aspecto divulgado, un kit para medir los niveles de expresión de siete genes diana de la ruta de señalización celular de NFkB en una muestra comprende:
uno o más componentes para determinar los niveles de expresión de los siete genes diana de la ruta de señalización celular de NFkB y
un aparato que comprende un procesador digital configurado para realizar el método de acuerdo con la presente invención como se describe en el presente documento, un medio de almacenamiento no transitorio que almacena instrucciones que son ejecutables por un dispositivo de procesamiento digital para realizar un método de acuerdo con la presente invención como se describe en el presente documento, o un programa informático que comprende medios de código de programa para hacer que un dispositivo de procesamiento digital realice un método de acuerdo con a la presente invención como se describe en el presente documento cuando el programa informático se ejecuta en el dispositivo de procesamiento digital,
en donde el uno o más componentes se seleccionan preferentemente del grupo que consiste en: un chip de micromatrices (por ejemplo, un chip de matriz de ADN, un chip de matriz de oligonucleótidos, un chip de matriz de proteínas), un anticuerpo, una pluralidad de sondas, secuenciación de ARN y un conjunto de cebadores, en donde los siete genes diana de la ruta de señalización celular de NFkB son CCL5, CXCL2, ICAM1, IL6, IL8, NFKBIA y TNFAIP2.
Por medio de dichos kits, los niveles de expresión de los siete genes diana de la ruta de señalización celular de NFkB pueden determinarse de una manera sencilla y cómoda. Ventajosamente, dado que se usan múltiples genes diana para inferir la actividad de la ruta de señalización celular de NFkB, puede lograrse una inferencia más robusta de la actividad de la ruta de señalización celular de NFkB.
De acuerdo con otro aspecto divulgado, los kits de la presente invención como se describen en el presente documento se usan para realizar el método de la presente invención como se describe en el presente documento.
La presente invención como se describe en el presente documento puede, por ejemplo, usarse también ventajosamente en relación con:
diagnóstico basado en la actividad inferida de la ruta de señalización celular de NFkB;
pronóstico basado en la actividad inferida de la ruta de señalización celular de NFkB;
prescripción de fármacos basada en la actividad inferida de la ruta de señalización celular de NFkB; predicción de la efectividad de fármacos basada en la actividad inferida de la ruta de señalización celular de NFkB; predicción de efectos adversos basada en la actividad inferida de la ruta de señalización celular de NFkB; monitorización de la efectividad de fármacos;
desarrollo de fármacos;
desarrollo de ensayos;
investigación de rutas;
estadificación del cáncer;
inscripción en un ensayo clínico basado en la actividad inferida de la ruta de señalización celular de NFkB; selección de la prueba posterior a realizar; y
selección de pruebas de diagnóstico complementario.
Las ventajas adicionales serán evidentes para los expertos en la materia tras leer y comprender las figuras adjuntas, la siguiente descripción y, en particular, después de leer los ejemplos detallados que se proporcionan a continuación. Debe entenderse que el método de la reivindicación 1, los kits de la reivindicación 6 o 7 y el uso de los kits de la reivindicación 8 tienen realizaciones preferidas similares y/o idénticas, en particular, como se define en las reivindicaciones dependientes.
Se entenderá que una realización preferida de la presente invención también puede ser cualquier combinación de las reivindicaciones dependientes o realizaciones anteriores con la respectiva reivindicación independiente.
Estos y otros aspectos de la invención serán evidentes a partir de y se aclararán con referencia a las realizaciones descritas en lo sucesivo en el presente documento.
Breve descripción de los dibujos
La Figura 1 muestra esquemática y ejemplarmente las rutas canónica y alternativa de activación de NFkB (véase Dolcet X. et al., "NF-kB in development and progression of human cancer", Virchows Archives, Vol. 446. N.° 5, 2005, páginas 475 a 482).
La Figura 2 muestra esquemáticamente y a modo de ejemplo un modelo matemático, en el presente documento, un modelo de red bayesiana, usado para modelar el programa transcripcional de la ruta de señalización celular de NFkB.
Las Figuras 3 a 6 muestran resultados de entrenamiento del modelo de red bayesiana a modo de ejemplo basado en la lista curada por evidencia de genes diana, la lista corta de 19 genes diana, la lista corta de 13 genes diana y la lista corta de 7 genes diana de la ruta de señalización celular de NFkB (véanse las Tablas 1 a 4), respectivamente.
La Figura 7 muestra las predicciones de la actividad de la ruta de señalización celular de NFkB del modelo de red bayesiana a modo de ejemplo entrenado usando la lista curada por evidencia de genes diana (véase la Tabla 1) para muestras de linfoma difuso de linfocitos B grandes (LDLBG) de GSE34171.
Las Figuras 8 a 11 muestran las predicciones de la actividad de la ruta de señalización celular NFkB del modelo de red bayesiana a modo de ejemplo entrenados usando la lista curada por evidencia de genes diana, la lista corta de 19 genes diana, la lista corta de 13 genes diana y la lista corta de 7 genes diana (véanse las Tablas 1 a 4), respectivamente, para muestras de líneas celulares epiteliales bronquiales humanas normales (NHBE) de E-MTAB-1312, que se estimularon con diferentes concentraciones de TNFa para diferentes tiempos de estimulación.
La Figura 12 muestra las predicciones de la actividad de la ruta de señalización celular de NFkB del modelo de red bayesiana a modo de ejemplo entrenado usando la lista curada por evidencia de genes diana (véase la Tabla 1) para células monocíticas de THP-1.
Las Figuras 13 a 16 muestran las predicciones de la actividad de la ruta de señalización celular de NFkB de los modelos de redes bayesianas a modo de ejemplo entrenados usando la lista curada por evidencia de genes diana, la lista corta de 19 genes diana, la lista corta de 13 genes diana y la lista corta de 7 genes diana (véanse las Tablas 1 a 4), respectivamente, para muestras de colon de GSE4183.
La Figura 17 muestra las predicciones de la actividad de la ruta de señalización celular de NFkB del modelo de red bayesiana a modo de ejemplo entrenado usando la lista curada por evidencia de genes diana (véase la Tabla 1) para líneas celulares de cáncer de mama de GSE10890.
La Figura 18 muestra las predicciones de la actividad de la ruta de señalización celular de NFkB del modelo de red bayesiana a modo de ejemplo entrenado usando la lista curada por evidencia de genes diana (véase la Tabla 1) para muestras de ovario de GSE20565.
La Figura 19 muestra las predicciones de la actividad de la ruta de señalización celular de NFkB del modelo de red bayesiana a modo de ejemplo entrenado usando la lista curada por evidencia de genes diana (véase la Tabla 1) para muestras de cáncer de mama de E-MTAB-1006.
La Figura 20 ilustra un pronóstico de pacientes de glioma (GSE16011) representado en un gráfico de Kaplan-Meier, en donde se emplea el modelo de red bayesiana a modo de ejemplo entrenado usando la lista de genes diana curada por evidencia (véase la Tabla 1).
La Figura 21 muestra los resultados de entrenamiento del modelo lineal a modo de ejemplo basado en la lista de genes diana curada por evidencia (véase la Tabla 1).
La Figura 22 muestra las predicciones de la actividad de la ruta de señalización celular de NFkB del modelo lineal a modo de ejemplo entrenado usando la lista de genes diana curada por evidencia (véase la Tabla 1) para muestras de líneas celulares epiteliales bronquiales humanas normales (NHBe ) de E-MTAB-1312, que se estimularon con diferentes concentraciones de TNFa para diferentes tiempos de estimulación.
La Figura 23 muestra las predicciones de la actividad de la ruta de señalización celular de NFkB del modelo lineal a modo de ejemplo entrenado usando la lista curada por evidencia de genes diana (véase la Tabla 1) para muestras de colon de GSE4183.
La Figura 24 muestra los resultados de entrenamiento del modelo de red bayesiana a modo de ejemplo basado en la amplia lista de la bibliografía de genes diana putativos de la ruta de señalización celular de NFkB (véase la Tabla 5).
La Figura 25 muestra las predicciones de la actividad de la ruta de señalización celular de NFkB del modelo de red bayesiana a modo de ejemplo entrenado usando la amplia lista de la bibliografía de genes diana putativos de la ruta de señalización celular de NFkB (véase la Tabla 5) para muestras de líneas celulares epiteliales bronquiales humanas normales (NHBE) de E-MTAB-1312, que se estimularon con diferentes concentraciones de TNFa para diferentes tiempos de estimulación.
La Figura 26 muestra las predicciones de la actividad de la ruta de señalización celular de NFkB del modelo de red bayesiana a modo de ejemplo entrenado usando la amplia lista de la bibliografía de genes diana putativos de la ruta de señalización celular de NFkB (véase la Tabla 5) para muestras de colon de GSE4183.
Descripción detallada de realizaciones
Los siguientes ejemplos meramente ilustran métodos particularmente preferidos y aspectos seleccionados en relación con los mismos. La enseñanza proporcionada en los mismos puede usarse para construir varias pruebas y/o kits, por ejemplo, para detectar, predecir y/o diagnosticar la actividad anormal de una o más rutas de señalización celular. Adicionalmente, tras usar métodos como se describen en el presente documento, la prescripción de medicamentos puede guiarse ventajosamente, puede realizarse la predicción de la respuesta al fármaco y monitorización de la efectividad de fármacos (y/o efectos adversos), puede predecirse y monitorizarse la resistencia a fármacos, por ejemplo, para seleccionar la prueba o pruebas posteriores que se realizarán (como una prueba de diagnóstico complementaria). Los siguientes ejemplos no han de interpretarse como limitaciones del alcance de la invención.
Ejemplo 1: Construcción del modelo matemático
Como se describe en detalle en la solicitud de patente internacional publicada WO 2013/011479 A2 ("Assessment of cellular signaling pathway activity using probabilistic modeling of target gene expression"), mediante la construcción de un modelo probabilístico, por ejemplo, un modelo de red bayesiana, e incorporando relaciones probabilísticas condicionales entre niveles de expresión de seis o más genes diana de una ruta de señalización celular, en el presente documento, la ruta de señalización celular de NFkB y el nivel de actividad de un elemento factor de transcripción (TF), en el presente documento, el elemento TF NFkB, controlando el elemento TF la transcripción de los seis o más genes diana de la ruta de señalización celular, un modelo tal puede usarse para determinar la actividad de la ruta de señalización celular con un alto grado de precisión. Por otra parte, el modelo probabilístico puede actualizarse fácilmente para incorporar conocimientos adicionales obtenidos por estudios clínicos posteriores, ajustando las probabilidades condicionales y/o añadiendo nuevos nodos al modelo para representar fuentes de información adicionales. De esta manera, el modelo probabilístico puede actualizarse según sea apropiado para incorporar los conocimientos médicos más recientes.
En otro enfoque fácil de comprender e interpretar descrito en detalle en la solicitud de patente internacional publicada WO 2013/011479 A2 ("Assessment of cellular signaling pathway activity using linear combination(s) of target gene expressions"), la actividad de una ruta de señalización celular, en el presente documento, la ruta de señalización celular de NFkB, puede determinarse construyendo y evaluando un modelo lineal o (pseudo-)lineal que incorpora relaciones entre los niveles de expresión de seis o más genes diana de la ruta de señalización celular y el nivel de un elemento de factor de transcripción (TF), en el presente documento, el elemento TF NFkB, controlando el elemento TF la transcripción de los seis o más genes diana de la ruta de señalización celular, estando el modelo basado al menos en parte en una o más combinación o combinaciones lineales de niveles de expresión de los seis o más genes diana.
En ambos enfoques, los niveles de expresión de seis o más genes diana pueden ser preferentemente mediciones del nivel de ARNm, que puede ser el resultado de, por ejemplo, (RT)-PCR y técnicas de micromatrices que usan sondas asociadas a las secuencias de ARNm de los genes diana, y de secuenciación de ARN. En otra realización, los niveles de expresión de los seis o más genes diana pueden medirse mediante niveles de proteína, por ejemplo, las concentraciones y/o la actividad de la proteína o proteínas codificadas por los genes diana.
Los niveles de expresión mencionados anteriormente pueden convertirse opcionalmente de muchas formas que podrían o podrían no adaptarse mejor a la solicitud. Por ejemplo, cuatro transformaciones diferentes de los niveles de expresión, por ejemplo, niveles de ARNm basados en micromatrices, pueden ser:
- "datos continuos", es decir, niveles de expresión obtenidos después del preprocesamiento de micromatrices usando algoritmos bien conocidos tales como MAS5.0 y fRMA,
- "puntuación z", es decir, niveles de expresión continuos escalados de manera que el promedio de todas las muestras sea 0 y la desviación estándar sea 1,
- "discreto", es decir, cada expresión por encima de un cierto umbral se establece en 1 y por debajo de él en 0 (por ejemplo, el umbral para un conjunto de sondas puede elegirse como la mediana de su valor en un conjunto de un número de positivos y el mismo número de muestras clínicas negativas),
- "difuso", es decir, los niveles de expresión continua se convierten en valores entre 0 y 1 usando una función sigmoidea del siguiente formato:
1 / (1 exp((thr- expr) / se)), siendo expr los niveles de expresión continuos, siendo thr el umbral como se mencionó anteriormente y siendo se un parámetro de suavizado que influye en la diferencia entre 0 y 1.
Uno de los modelos lineales más sencillos que pueden construirse es un modelo que tiene un nodo que representa el elemento del factor de transcripción (TF), en el presente documento, el elemento TF NFkB, en una primera capa y nodos ponderados que representan mediciones directas de los niveles de expresión de los genes diana, por ejemplo, por un conjunto de sondas que está particularmente altamente correlacionado con el gen diana particular, por ejemplo, en experimentos de micromatrices o (q)PCR, en una segunda capa. Las ponderaciones pueden basarse en cálculos de un conjunto de datos de entrenamiento o en conocimientos de expertos. Este enfoque de usar, en el caso de que posiblemente se midan múltiples niveles de expresión por gen diana (por ejemplo, en el caso de experimentos de micromatrices, donde un gen diana puede medirse con múltiples conjuntos de sondas), solo un nivel de expresión por gen diana es particularmente sencillo. Una forma específica de seleccionar el nivel de expresión que se usa para un gen diana particular es usar el nivel de expresión del conjunto de sondas que es capaz de separar mejor las muestras activas y pasivas de un conjunto de datos de entrenamiento. Un método para determinar este conjunto de sondas es realizar una prueba estadística, por ejemplo, la prueba t, y seleccionar el conjunto de sondas con el valor p más bajo. Los niveles de expresión del conjunto de datos de entrenamiento del conjunto de sondas con el valor p más bajo son, por definición, el conjunto de sondas con la menor probabilidad de que los niveles de expresión de las muestras activas y pasivas (conocidas) se superpongan. Otro método de selección se basa en razones de probabilidades. En un modelo tal, se proporcionan uno o más nivel o niveles de expresión para cada uno de los seis o más genes diana y la una o más combinación o combinaciones lineales comprenden una combinación lineal que incluye para cada uno de los seis o más genes diana un término ponderado, basándose cada término ponderado en solo un nivel de expresión del uno o más nivel o niveles de expresión proporcionados para el gen diana respectivo. Si se elige el único nivel de expresión por gen diana como se describe anteriormente, el modelo puede denominarse modelo de "conjuntos de sondas más discriminantes".
En una alternativa al modelo de "conjuntos de sondas más discriminantes", es posible, en el caso de que posiblemente se midan múltiples niveles de expresión por gen diana, hacer uso de todos los niveles de expresión que se proporcionan por gen diana. En un modelo tal, se proporcionan uno o más nivel o niveles de expresión para cada uno de los seis o más genes diana y la una o más combinación o combinaciones lineales comprenden una combinación lineal de todos los niveles de expresión del uno o más nivel o niveles de expresión proporcionado para los seis o más genes diana. En otras palabras, para cada uno de los seis o más genes diana, cada uno de los uno o más nivel o niveles de expresión proporcionados para el gen diana respectivo puede ponderarse en la combinación lineal por su propio peso (individual). Esta variante puede denominarse modelo de "todos los conjuntos de sondas". Tiene la ventaja de ser relativamente sencillo y al mismo tiempo hacer uso de todos los niveles de expresión proporcionados.
Los dos modelos descritos anteriormente tienen en común que son lo que pueden considerarse modelos de "capa única", en los cuales el nivel del elemento TF se calcula basándose en una combinación lineal de niveles de expresión del uno o más conjuntos de sondas de los seis o más genes diana.
Después del nivel del elemento TF, en el presente documento, el elemento TF NFkB, se ha determinado evaluando el modelo respectivo, el nivel del elemento Tf determinado puede establecerse como umbral para inferir la actividad de la ruta de señalización celular, en el presente documento, la ruta de señalización celular de NFkB. Un método preferido para calcular un umbral tan apropiado es comparando los niveles del elemento TF determinados wlc de muestras de entrenamiento que se sabe que tienen una ruta de señalización celular pasiva y muestras de entrenamiento con una ruta de señalización celular activa. Un método que lo hace y también tiene en cuenta la varianza en estos grupos se da mediante el uso de un umbral
Figure imgf000009_0001
donde a y p son la desviación estándar y la media de los niveles del elemento TF determinados wlc para las muestras de entrenamiento. En caso de que solo haya una pequeña cantidad de muestras disponibles en las muestras de entrenamiento activo y/o pasivo, puede añadirse un pseudorecuento a las varianzas calculadas basándose en el promedio de las varianzas de los dos grupos:
Figure imgf000009_0002
donde v es la varianza de los niveles del elemento TF determinados wlc de los grupos, X es un pseudorecuento positivo, por ejemplo, 1 o 10, y nact y npas son el número de muestras activas y pasivas, respectivamente. A continuación, puede obtenerse la desviación estándar a tomando la raíz cuadrada de la varianza v.
El umbral puede restarse de los niveles del elemento TF determinados wlc para facilitar la interpretación, dando como resultado una puntuación de actividad de la ruta de señalización celular en la cual los valores negativos corresponden a una ruta de señalización celular pasiva y los valores positivos corresponden a una ruta de señalización celular activa.
Como alternativa a los modelos de "capa única" descritos anteriormente, también puede usarse uno de "dos capas" en un ejemplo. En un modelo tal, se calcula un valor de resumen para cada gen diana usando una combinación lineal basada en las intensidades medidas de sus conjuntos de sondas asociados ("primera capa (inferior)"). El valor de resumen calculado se combina posteriormente con los valores de resumen de los otros genes diana de la ruta de señalización celular usando una combinación lineal adicional ("segunda capa (superior)"). De nuevo, las ponderaciones pueden aprenderse de un conjunto de datos de entrenamiento o basarse en el conocimiento de expertos o una combinación de los mismos. Expresado de manera diferente, en el modelo de "dos capas", se proporcionan uno o más nivel o niveles de expresión para cada uno de los seis o más genes diana y una o más combinación o combinaciones lineales comprenden para cada uno de los seis o más genes diana una primera combinación lineal de todos los niveles de expresión del uno o más nivel o niveles de expresión proporcionados para el gen diana respectivo ("primera capa (inferior)"). El modelo se basa además al menos en parte en una combinación lineal adicional que incluye para cada uno de los seis o más genes diana un término ponderado, basándose cada término ponderado en la primera combinación lineal para el gen diana respectivo ("segunda capa (superior)").
El cálculo de los valores de resumen puede, en una versión preferida del modelo de "dos capas", incluir definir un umbral para cada gen diana usando los datos de entrenamiento y restar el umbral de la combinación lineal calculada, produciendo el resumen del gen diana. En este caso, el umbral puede elegirse de manera que un valor de resumen del gen diana negativo corresponda a un gen diana regulado negativamente y que un valor de resumen del gen diana positivo corresponda a un gen diana regulado positivamente. También, es posible que los valores de resumen del gen diana se transformen usando, por ejemplo, una de las transformaciones descritas anteriormente (difusa, discreta, etc.), antes de que se combinen en la "segunda capa (superior)".
Una vez que se ha determinado el nivel del elemento TF mediante la evaluación del modelo de "dos capas", el nivel del elemento TF determinado puede establecerse como umbral para inferir la actividad de la ruta de señalización celular, como se ha descrito anteriormente.
En lo sucesivo, los modelos descritos anteriormente se denominan colectivamente modelos "(pseudo-)lineales". Una descripción más detallada del entrenamiento y uso de modelos probabilísticos, por ejemplo, un modelo de red bayesiana, se proporciona en el Ejemplo 3 a continuación.
Ejemplo 2: Selección de genes diana
Un factor de transcripción (TF) es un complejo de proteínas (es decir, una combinación de proteínas unidas en una estructura específica) o una proteína que es capaz de regular la transcripción de genes diana al unirse a secuencias de ADN específicas, controlando de esta manera la transcripción de información genética de ADN a ARNm. El ARNm producido directamente debido a esta acción del complejo TF se denomina en el presente documento un "gen diana directo" (del factor de transcripción). La activación de la vía de señalización celular también puede resultar en una mayor transcripción de genes secundarios, denominados "genes diana indirectos". En lo sucesivo, se prefieren los modelos (pseudo-)lineales o modelos de redes bayesianas (como modelos matemáticos a modo de ejemplo) que comprenden o consisten en genes diana directos como enlaces directos entre la actividad de la vía de señalización celular y el nivel de ARNm, sin embargo, la distinción entre genes diana directos e indirectos no siempre es evidente. En el presente documento, se presenta un método para seleccionar genes diana directos usando una función de puntuación basada en los datos de la bibliografía científica disponible. Sin embargo, no puede descartarse una selección accidental de genes diana indirectos debido a la información limitada, así como a las variaciones biológicas e incertidumbres. Para seleccionar los genes diana, se empleó la base de datos MEDLINE del National Institute of Health accesible en "www.ncbi.nlm.nih.gov/pubmed" y denominado además en el presente documento "Pubmed" para generar dos listas de genes diana.
Las publicaciones que contenían genes diana de NFkB putativos se buscaron mediante consultas tales como (NFkB Y "gen diana") en el período del segundo y tercer trimestre de 2013. Las publicaciones resultantes se analizaron posteriormente de forma manual siguiendo la metodología que se describe con más detalle a continuación.
Se seleccionaron genes diana de ARNm de la ruta de señalización celular específica de la bibliografía científica, mediante el uso de un sistema de clasificación en el que se dio una clasificación a la evidencia científica para un gen diana específico, dependiendo del tipo de experimentos científicos en los que se acumuló la evidencia. Si bien algunas pruebas experimentales sugieren simplemente que un gen es un gen diana directo, como, por ejemplo, un ARNm que aumenta según se detecta mediante una intensidad creciente de un conjunto de sondas en una micromatriz de una línea celular en la que se sabe que la ruta de señalización celular de NFkB está activa, otra evidencia puede ser muy fuerte, como la combinación de un sitio de unión TF de la ruta de señalización celular de NFkB identificada y la recuperación de este sitio en un ensayo de inmunoprecipitación de cromatina (ChIP) después de la estimulación de la ruta de señalización celular específica en la célula y aumento de ARNm después de la estimulación específica de la ruta señalización celular en una línea celular.
En la bibliografía científica pueden identificarse diversos tipos de experimentos para encontrar genes diana de rutas de señalización celular específicas:
1. Experimentos ChIP en los cuales se muestra la unión directa de un TF de la ruta de señalización celular de interés a su sitio de unión en el genoma. Ejemplo: Mediante el uso de la tecnología de inmunoprecipitación de cromatina (ChIP), posteriormente, los sitios de unión de TF NFkB funcionales putativos en el ADN de líneas celulares con y sin inducción activa de la ruta de señalización celular de NFkB, por ejemplo, por estimulación con factor de necrosis tumoral a (TNFa) o lipopolisacárido (LPS), se identificaron, como un subconjunto de los sitios de unión reconocidos puramente basándose en la secuencia de nucleótidos. La funcionalidad putativa se identificó como evidencia derivada de ChIP de que se encontró que el TF se unía al sitio de unión del ADN.
2. Ensayos de cambio de movilidad electroforética (EMSA) que muestran la unión in vitro de un TF a un fragmento de ADN que contiene la secuencia de unión. En comparación con la evidencia basada en ChIP, la evidencia basada en EMSA es menos sólida, ya que no puede traducirse a la situación in vivo.
3. Estimulación de la ruta de señalización celular y medición de la expresión de ARNm usando una micromatriz, secuenciación de ARN, PCR cuantitativa u otras técnicas, usando líneas celulares inducibles por la ruta de señalización celular de NFkB y midiendo los perfiles de ARNm medidos al menos uno, pero preferentemente varios puntos de tiempo después de la inducción, en presencia de cicloheximida, que inhibe la traducción a proteína, por lo tanto, se supone que los ARNm inducidos son genes diana directos.
4. Similar a 3, pero, alternativamente, mide la expresión de ARNm adicionales en dirección 3' con mediciones de abundancia de proteínas, tales como transferencia Western.
5. Identificación de sitios de unión de TF en el genoma mediante un enfoque bioinformático. Ejemplo para el elemento TF NFkB: Usando el motivo de unión a NFkB 5'-GGGRNWYYCC-3' (R: A o G, N: cualquier nucleótido, W: A o T, Y: C o T), se ejecutó un programa de software en la secuencia del genoma humano y se identificaron los sitios de unión potenciales, tanto en regiones promotoras de genes como en otras regiones genómicas.
6. Similar a 3, solo en ausencia de cicloheximida.
7. Similar a 4, solo en ausencia de cicloheximida.
En la forma más sencilla, puede asignarse a cada gen potencial 1 punto para cada uno de estos enfoques experimentales en los cuales el gen se identificó como un gen diana de la familia de factores de transcripción NFkB. Usando esta estrategia de clasificación relativa, puede hacerse una lista de los genes diana más fiables.
Como alternativa, la clasificación de otra manera puede usarse para identificar los genes diana que tienen más probabilidades de ser genes diana directos, dando un mayor número de puntos a la tecnología que proporciona la mayor evidencia de un gen diana directo en vivo. En la lista anterior, esto significaría 8 puntos para el enfoque experimental 1), 7 para 2) y bajando a 1 punto para el enfoque experimental 8). Esta lista puede denominarse una "lista general de genes diana".
A pesar de las variaciones biológicas e incertidumbres, los inventores supusieron que los genes diana directos son los que tienen más probabilidades de inducirse de forma independiente del tejido. Una lista de estos genes diana puede denominarse una "lista de genes diana curada por pruebas". Esta lista de genes diana curada por pruebas se ha usado para construir modelos computacionales de la ruta de señalización celular de NFkB que pueden aplicarse a muestras procedentes de diferentes fuentes de tejido.
Lo siguiente ilustrará a modo de ejemplo cómo se construyó específicamente la selección de una lista de genes diana curada por evidencia para la ruta de señalización celular de NFkB.
Se introdujo una función de puntuación que daba un punto por cada tipo de evidencia experimental, tales como ChIP, EMSA, expresión diferencial, atenuación/inactivación génica, ensayo del indicador del gen de la luciferasa, análisis de secuencia, que se informó en una publicación. La misma evidencia experimental a veces se menciona en múltiples publicaciones, lo que da como resultado un número correspondiente de puntos, por ejemplo, dos publicaciones que mencionan un resultado de ChIP dan como resultado el doble de la puntuación que se da para un solo resultado de ChIP. Se realizaron análisis adicionales para permitir solo genes que tenían diversos tipos de evidencia experimental y no solo un tipo de evidencia experimental, por ejemplo, expresión diferencial. Finalmente, se calculó una puntuación de evidencia para todos los genes diana de NFkB putativos y se seleccionaron todos los genes diana de NFkB putativos con una puntuación de evidencia de 5 o más (que se muestran en la Tabla 1). El nivel de corte de 5 se eligió heurísticamente para proporcionar evidencia suficientemente sólida.
Los inventores realizaron una selección adicional de la lista de genes diana curada por pruebas (enumerada en la Tabla 1). Se seleccionaron los genes diana de la lista curada por evidencias de pruebas que demostraron ser más probatorios en la determinación de la actividad de la ruta de señalización celular de NFkB de las muestras de entrenamiento. La selección se realizó usando una combinación de la puntuación de evidencia de la bibliografía y los resultados del entrenamiento usando dos conjuntos de datos diferentes. Se hicieron tres clasificaciones basadas en la puntuación de la evidencia, la puntuación más alta clasificada en primer lugar y cada punto menos dan como resultado un rango más bajo, y las razones de probabilidades "suaves" de todos los conjuntos de sondas incluidos (véase la Tabla 1) se calcularon como se describe en el presente documento usando los conjuntos de datos GSE12195 y E-MTAB-1312. Los valores absolutos de las razones de posibilidades "suaves" transformadas de log2 se usaron para clasificar los conjuntos de sondas; las razones de posibilidades más altas se clasificaron en primer lugar, etcétera. Como se describe en el presente documento, las muestras de ABC DLBCL de GSE12195 se eligieron como muestras de entrenamiento de NFkB activas, mientras que las muestras normales de este conjunto de datos se eligieron como muestras de entrenamiento de NFkB pasivas. Además, se calculó un segundo conjunto de razones de probabilidades "suaves" usando muestras de E-MTAB-1312, un conjunto de datos de entrenamiento alternativo de NFkB, las muestras de control se usaron como muestras de NFkB pasivas y las muestras estimuladas con diferentes concentraciones de TNFa durante 2 horas se seleccionaron como muestras de entrenamiento de NFkB activas. Basándose en el intervalo promedio, se seleccionó un conjunto preferido de genes diana que tiene al menos un grupo de sondas asociado con un intervalo promedio menor o igual a 20 para la "lista corta de 19 genes diana". Se seleccionó un conjunto más preferido de genes diana que tenía una clasificación promedio menor o igual a 15 para la "lista corta de 13 genes diana". Se seleccionó un conjunto lo más preferido de genes diana que tenían una clasificación promedio menor o igual a 12 para la "lista corta de 7 genes diana". La lista corta de 19 genes diana, la lista de 13 genes diana y la lista de 7 genes diana se muestran en las Tablas 2 a 4, respectivamente.
Tabla 1: "Lista curada por evidencia de genes diana" de la ruta de señalización celular de NFkB usada en los modelos de ruta de señalización celular de NFkB y conjuntos de sondas asociadas usados para medir el nivel de expresión de ARNm de los genes diana.
Figure imgf000011_0001
continuación
Figure imgf000012_0001
Tabla 2: "Lista corta de 19 genes diana" de genes diana de la ruta de señalización celular de NFkB basada en la p n i n vi ni l i li r fí l r z n r ili " v " n E121 E-MTAB-112.
Figure imgf000012_0002
continuación
Figure imgf000013_0001
Tabla 3: "Lista corta de 13 genes diana" de genes diana de la ruta de señalización celular de NFkB basada en la p n i n vi n i l i li r fí l r z n r ili " v " n E121 E-MTAB-1 12.
Figure imgf000013_0002
Tabla 4: "Lista corta de 7 genes diana" de genes diana de la ruta de señalización celular de NFkB basada en la p n i n vi n i l i li r fí l r z n r ili " v " n E121 E-MTAB-1 12
Figure imgf000013_0003
Ejemplo 3: Entrenamiento y uso del modelo matemático
Antes de que el modelo matemático pueda usarse para inferir la actividad de la ruta de señalización celular, en el presente documento, la ruta de señalización celular de NFkB, el modelo debe estar apropiadamente entrenado. Si el modelo matemático es un modelo probabilístico, por ejemplo, un modelo de red bayesiana, basado al menos en parte en probabilidades condicionales que relacionan el elemento TF NFkB y los niveles de expresión de los seis o más genes diana de la ruta de señalización celular de NFkB medidos en una muestra, el entrenamiento puede realizarse preferentemente como se describe en detalle en la solicitud de patente internacional publicada WO 2013/011479 A2 ("Assessment of cellular signaling pathway activity using probabilistic modeling of target gene expression").
Si el modelo matemático se basa al menos en parte en una o más combinación o combinaciones lineales de niveles de expresión de los seis o más genes diana de la ruta de señalización celular de NFkB medida en la muestra, el entrenamiento puede realizarse preferentemente como se describe en detalle en la solicitud de patente internacional publicada WO 2014/102668 A2 ("Assessment of cellular signaling pathway activity using linear combination(s) of target gene expressions").
En el presente documento, se usó primero un modelo de red bayesiana a modo de ejemplo como se muestra en la Figura 2 para modelar el programa transcripcional de la ruta de señalización celular de NFkB de una manera sencilla. El modelo consiste en tres tipos de nodos: (a) un elemento de factor de transcripción (TF) (con estados "ausente" y "presente") en una primera capa 1; (b) genes diana TG1 , TG2 , TGn (con estados "activo" e "inactivo") en una segunda capa 2, y; (c) nodos de medición vinculados a los niveles de expresión de los genes diana en una tercera capa 3. Estos pueden ser conjuntos de sondas de micromatrices PS-i , 1 , PS-i , 2 , PS-i ,3, PS2 , 1 , PSn , i , PDn.m (con estados "bajo" y "alto"), como se usa preferentemente en el presente documento, pero también podrían ser otras medidas de expresión génica tales como RNAseq o RT-qPCR.
Una implementación adecuada del modelo matemático, en el presente documento, el modelo de red bayesiana a modo de ejemplo, se basa en datos de micromatrices. El modelo describe (i) cómo los niveles de expresión de los genes diana dependen de la activación del elemento TF y (ii) cómo las intensidades de conjuntos de sondas, a su vez, dependen de los niveles de expresión de los genes diana respectivos. Para lo último, las intensidades del conjunto de sondas pueden tomarse de micromatrices Affymetrix HG-U133Plus2.0 preprocesadas con fRMA, que están ampliamente disponibles de Gene Expression Omnibus (GEO, www.ncbi.nlm.nih.gov/geo) y ArrayExpress (www. ebi.ac.uk/arrayexpress).
Como el modelo de red bayesiana a modo de ejemplo es una simplificación de la biología de una ruta de señalización celular, en el presente documento, la ruta de señalización celular de NFkB, y como las mediciones biológicas son normalmente ruidosas, se optó por un enfoque probabilístico, es decir, las relaciones entre (i) el elemento TF y los genes diana, y (ii) los genes diana y sus respectivos conjuntos de sondas, se describen en términos probabilísticos. Adicionalmente, se asumió que la actividad de la ruta de señalización celular oncogénica que impulsa el crecimiento tumoral no se altera de forma transitoria y dinámica, sino a largo plazo o incluso se altera irreversiblemente. Por lo tanto, se desarrolló el modelo de red bayesiana a modo de ejemplo para la interpretación de una condición celular estática. Por esta razón, las características complejas de la ruta de señalización celular dinámica no se incorporaron al modelo.
Una vez que se construye y se calibra el modelo de red bayesiana a modo de ejemplo (véase a continuación), el modelo puede usarse en datos de micromatrices de una nueva muestra introduciendo las mediciones del conjunto de sondas como observaciones en la tercera capa 3, e infiriendo hacia atrás en el modelo cuál debe haber sido la probabilidad de que el elemento TF esté "presente". En este caso, se considera "presente" el fenómeno de que el elemento TF esté unido al ADN y esté controlando la transcripción de los genes diana de la ruta de señalización celular, y "ausente" el caso de que el elemento TF no esté controlando la transcripción. Esta probabilidad es, por tanto, la lectura principal que puede usarse para indicar la actividad de la ruta de señalización celular, en el presente documento, la ruta de señalización celular de NFkB, que a continuación puede traducirse en las probabilidades de que la ruta de señalización celular esté activa tomando la relación entre la probabilidad de que esté activa frente a la de estar inactiva (es decir, las probabilidades están dadas por p/(1-p), donde p es la probabilidad predicha de que la ruta de señalización celular esté activa).
En el modelo de red bayesiana a modo de ejemplo, las relaciones probabilísticas se han hecho cuantitativas para permitir un razonamiento probabilístico cuantitativo. Para mejorar el comportamiento de generalización entre tipos de tejidos, los parámetros que describen las relaciones probabilísticas entre (i) el elemento TF y los genes diana han sido cuidadosamente seleccionados. Si el elemento TF está "ausente", lo más probable es que el gen diana esté "inactivo", por tanto, se elige una probabilidad de 0,95 para esto, y se elige una probabilidad de 0,05 para que el gen diana esté "activo". La última probabilidad (distinta de cero) es para dar cuenta de la posibilidad (rara) de que el gen diana esté regulado por otros factores o de que se observe accidentalmente como "activo" (por ejemplo, debido al ruido de medición). Si el elemento TF está "presente", entonces con una probabilidad de 0,70, el gen diana se considera "activo", y con una probabilidad de 0,30 el gen diana se considera "inactivo". Los últimos valores se eligen de esta manera, debido a que puede haber varias causas por las que un gen diana no se expresa en gran medida aunque el elemento TF esté presente, por ejemplo, porque la región promotora del gen está metilada. En el caso de que un gen diana no esté regulado positivamente por el elemento TF, sino regulado negativamente, las probabilidades se eligen de manera similar, pero reflejando la regulación negativa en presencia del elemento TF. Los parámetros que describen las relaciones entre (ii) los genes diana y sus respectivos conjuntos de sondas se han calibrado con datos experimentales. Para lo último, en este ejemplo, se usaron datos de micromatrices de muestras de pacientes que se sabe que tienen una ruta de señalización celular de NFkB activa mientras que se usaron muestras normales, sanas del mismo conjunto de datos como muestras de la ruta de señalización celular de NFkB inactiva, pero esto también podría realizarse usando experimentos de líneas celulares u otras muestras de pacientes con un estado conocido de actividad de la ruta de señalización celular. Las tablas de probabilidad condicional resultantes vienen dadas por:
A: r n i n r l iiv m n
Figure imgf000014_0001
B: r n i n r l n iv m n
Figure imgf000014_0002
En estas tablas, las variables AL i j , AHi j , PLi j , y PHi j indican el número de muestras de calibración con un complejo de transcripción "ausente" (A) o "presente" (P) que tienen una intensidad del conjunto de sondas "baja" (L) o "alta" (H), respectivamente. Se han añadido recuentos ficticios para evitar probabilidades extremas de 0 y 1.
Para discretizar las intensidades del conjunto de sondas observadas, para cada conjunto de sondas PSi j se usó un umbral ti j , por debajo del cual la observación se denomina "baja" y por encima del cual se denomina "alta". Este umbral se ha elegido para que sea la intensidad media (ponderada) del conjunto de sondas en el conjunto de datos de calibración usado. Debido al ruido de los datos de micromatrices, se usó un método difuso al comparar la intensidad de un conjunto de sonda observado con su umbral, asumiendo una distribución normal con una desviación estándar de 0,25 (en una escala log2) alrededor de la intensidad informada, y determinando la masa de probabilidad por debajo y por encima del umbral. En el presente documento, una razón de probabilidades calculada en combinación con un pseudo-recuento y usando masas de probabilidad en lugar de valores de medición deterministas se denomina razón de probabilidades "suave".
Pueden encontrarse detalles adicionales sobre la inferencia de la actividad de la ruta de señalización celular usando modelos matemáticos de la expresión de genes diana en Verhaegh W. et al., "Selection of personalized patient therapy through the use of knowledge-based computational models that identify tumor-driving signal transduction pathways", Cancer Research, Vol. 74, N.° 11, 2014, páginas 2936 a 2945.
Si en lugar de la red bayesiana a modo de ejemplo descrita anteriormente, se emplea un modelo (pseudo-)lineal como se describe en el Ejemplo 1 anterior, los pesos que indican el signo y la magnitud de la correlación entre los nodos y un umbral para indicar si un nodo está "ausente" o "presente" deberían determinarse antes de que el modelo pueda usarse para inferir la actividad de la ruta de señalización celular en una muestra de prueba. Podría usarse el conocimiento experto para completar los pesos y el umbral a priori, pero normalmente el modelo se entrenaría usando un conjunto representativo de muestras de entrenamiento, de los cuales preferentemente se conoce la verdad fundamental, por ejemplo, datos de expresión de conjuntos de sondas en muestras con un complejo de factor de transcripción "presente" conocido (= ruta de señalización celular activa) o complejo de factor de transcripción "ausente" (= ruta de señalización celular pasiva).
Se conoce en el campo una multitud de algoritmos de entrenamiento (por ejemplo, regresión) que toman en cuenta la topología del modelo y cambian los parámetros del modelo, en este caso, los pesos y el umbral, de tal manera que la salida del modelo, en este caso, una puntuación lineal ponderada, se optimiza. Como alternativa, también es posible calcular los pesos directamente a partir de los niveles observados de expresión sin la necesidad de un algoritmo de optimización.
Un primer método, denominado método "blanco y negro" en el presente documento, se reduce a un sistema ternario, en el cual cada peso es un elemento del conjunto {-1, 0, 1}. Si esto se pone en un contexto biológico, el -1 y el 1 corresponden a genes diana o conjuntos de sondas que están regulados negativa y positivamente en caso de actividad de la vía ruta de señalización celular, respectivamente. En caso de que no se pueda demostrar estadísticamente que un conjunto de sondas o un gen diana esté regulado positiva o negativamente, recibe un peso de 0. En un ejemplo, puede usarse una prueba t de dos muestras de lado izquierdo y de lado derecho de los niveles de expresión de la ruta de señalización celular activa frente a los niveles de expresión de las muestras con una ruta de señalización celular pasiva para determinar si una sonda o gen está regulado positiva o negativamente dados los datos de entrenamiento usados. En los casos en los cuales el promedio de las muestras activas sea estadísticamente mayor que las muestras pasivas, es decir, el valor p está por debajo de un cierto umbral, por ejemplo, 0,3, se determina que el gen o conjunto de sondas diana está regulado positivamente. A la inversa, en los casos en los cuales el promedio de las muestras activas sea estadísticamente menor que las muestras pasivas, se determina que el gen o conjunto de sondas diana está regulado negativamente tras la activación de la ruta de señalización celular. En caso de que el valor p más bajo (del lado izquierdo o derecho) exceda el umbral mencionado anteriormente, el peso del gen diana o el conjunto de sondas puede definirse que es 0.
Un segundo método, denominado "probabilidades de registro" - pesos en el presente documento, se basa en el logaritmo (por ejemplo, en base e) de la razón de posibilidades. La razón de probabilidades para cada gen diana o conjunto de sondas se calcula basándose en el número de muestras de entrenamiento positivas y negativas para las que el nivel del conjunto de sondas/ gen diana está por encima y por debajo del umbral correspondiente, por ejemplo, la mediana (ponderada) de todas las muestras de entrenamiento. Puede añadirse un pseudo recuento para eludir las divisiones entre cero. Otro refinamiento es contar las muestras por encima o por debajo del umbral de una manera algo más probabilística, asumiendo que los niveles de conjuntos de sondas/genes diana están, por ejemplo, distribuidos normalmente alrededor de su valor observado con una cierta desviación estándar especificada (por ejemplo, 0,25 en una escala de 2-log) y contando la masa de probabilidad por encima y por debajo del umbral.
En el presente documento, se usaron como un ejemplo los datos disponibles públicamente sobre la expresión de muestras de pacientes a partir de linfoma difuso de linfocitos B grandes (LDLBG), similar a linfocitos B activados (ABC), que se sabe que tiene una ruta de señalización celular de NFkB activa, y células normales que se sabe que tienen una ruta de señalización celular de NFkB pasiva (GSE12195 disponible en Gene Expression Omnibus (GEO, www.ncbi.nlm.nih.gov/geo, consultado por última vez el 9 de octubre de 2013). Como alternativa, pueden usarse muestras de pacientes o líneas celulares estimuladas y privadas de agentes activadores de NFkB tales como TNFa y LPS u otro tejido inflamatorio frente al tejido normal, por ejemplo, E-MTAB-1312 o GSE16650.
Las Figuras 3 a 6 muestran resultados de entrenamiento del modelo de red bayesiana a modo de ejemplo basado en la lista curada por evidencia de genes diana, la lista corta de 19 genes diana, la lista corta de 13 genes diana y la lista corta de 7 genes diana de la ruta de señalización celular de NFkB (véanse las Tablas 1 a 4), respectivamente. En los diagramas, el eje vertical indica las probabilidades de que el elemento TF esté "presente" respecto a "ausente", que corresponde a que la ruta de señalización celular de NFkB esté activa respecto a inactiva, en donde los valores por encima del eje horizontal corresponden a que el elemento TF es más probable que esté "presente"/activo y los valores por debajo del eje horizontal indican que las probabilidades de que el elemento TF esté "ausente"/inactivo son mayores que las probabilidades de que esté "presente"/activo. El grupo de linfocitos B activados (ABC) (grupo 1), que se sabe que tiene una ruta de señalización celular de NFkB activa, se le asignó un marcador NFkB activo, mientras que el grupo que abarca las muestras normales (grupo 7) que se sabe que tienen una ruta de señalización celular de NFkB pasiva se marcó como NFkB inactivo. Se logró una puntuación perfecta para las muestras de entrenamiento para los cuatro modelos, teniendo todos los ABC activos y todas las muestras normales una ruta de señalización celular de NFkB pasiva. Como cabía esperar, las probabilidades de las muestras de entrenamiento se vuelven menos extremas a medida que se incluyen menos genes diana en el modelo. Dentro del mismo conjunto de datos, se predijo correctamente que los linfocitos B de memoria sanos, no estimulados y los linfocitos B vírgenes (grupos 5 y 6, respectivamente) tenían una ruta de señalización celular de NFkB pasiva con algunas excepciones en los modelos de 19 y 7 genes diana. Se predijo que la gran mayoría de las otras muestras de linfoma en el linfoma de linfocitos B del centro germinal (GCB) (grupo 4), el linfoma folicular (grupo 3), la línea de células linfoblastoides (grupo 2) y todas menos una en el linfoma difuso de linfocitos B grandes adicional (DLBCL) con subtipo desconocido (grupo 8) tenían una ruta de señalización celular de NFkB activa en los cuatro modelos. Para GCB, se sabe que una alta fracción de tumores (> 50 %) tiene una mutación en al menos uno de los genes reguladores de NFkB, que probablemente se correlacione con la actividad aberrante de NFkB (véase, por ejemplo, Campagno M. et al., "Mutations of multiple genes cause deregulation of NF-kappaB in diffuse large B-cell lymphoma", Nature, Vol. 459, N.° 7247, 2009, páginas 717 a 721). También otros estudios señalaron que la activación constitutiva de NFkB es una característica común para la mayoría de las neoplasias malignas hematológicas (véase, por ejemplo, Keutgens A. et al., "Deregulated NF-kB activity in haematological malignacies", Biochemical Pharmacology, Vol. 72, N.° 9, 2006, páginas 1069 a 1080), lo que podría explicar parcialmente la alta fracción de actividad de NFkB en estos grupos que cubren diferentes neoplasias hematológicas. (Leyenda: 1 - ABC DLBCL; 2 - Línea celular linfoblastoide; 3 - Linfoma folicular; 4 - GCB DLBCL; 5 -Linfocitos B de memoria; 6 - Linfocitos B vírgenes; 7 - Normal; 8 - Subtipo desconocido de DLBCL)
En lo sucesivo, los resultados de validación del modelo de red bayesiana a modo de ejemplo entrenado usando la lista de genes diana curada por evidencia, la lista corta de 19 genes diana, la lista corta de 13 genes diana y la lista corta de 7 genes diana, respectivamente, se muestran en las Figuras 7 a 19.
La Figura 7 muestra las predicciones de la actividad de la ruta de señalización celular de NFkB del modelo de red bayesiana a modo de ejemplo entrenado usando la lista curada por evidencia de genes diana (véase la Tabla 1) para muestras de linfoma difuso de linfocitos B grandes (LDLBG) de GSE34171. En el diagrama, el eje vertical indica las probabilidades de que el elemento TF esté "presente" respecto a "ausente", que corresponde a que la ruta de señalización celular de NFkB esté activa respecto a inactiva, en donde los valores por encima del eje horizontal corresponden a que el elemento TF es más probable que esté "presente"/activo y los valores por debajo del eje horizontal indican que las probabilidades de que el elemento TF esté "ausente"/inactivo son mayores que las probabilidades de que esté "presente"/activo. Se predijo que todas las muestras tenían una ruta de señalización celular de NFkB activa. Se sabe que los linfomas de DLBCL tienen una actividad NFkB aberrante (véase, por ejemplo, Keutgens A. et al., "Deregulated NF-kB activity in haematological malignancies", Biochemical Pharmacology, Vol. 72, N.° 9, 2006, páginas 1069 a 1080).
Las Figuras 8 a 11 muestran las predicciones de la actividad de la ruta de señalización celular NFkB del modelo de red bayesiana a modo de ejemplo entrenados usando la lista curada por evidencia de genes diana, la lista corta de 19 genes diana, la lista corta de 13 genes diana y la lista corta de 7 genes diana (véanse las Tablas 1 a 4), respectivamente, para muestras de líneas celulares epiteliales bronquiales humanas normales (NHBE) de E-MTAB-1312, que se estimularon con diferentes concentraciones de TNFa para diferentes tiempos de estimulación. En los diagramas, el eje vertical indica las probabilidades de que el elemento TF esté "presente" respecto a "ausente", que corresponde a que la ruta de señalización celular de NFkB esté activa respecto a inactiva, en donde los valores por encima del eje horizontal corresponden a que el elemento TF es más probable que esté "presente"/activo y los valores por debajo del eje horizontal indican que las probabilidades de que el elemento TF esté "ausente"/inactivo son mayores que las probabilidades de que esté "presente"/activo. Una estimulación de solo 0,5 h es aparentemente demasiado corta para que la ruta de señalización celular de NFkB se active (grupos 5, 9 y 13), mientras que una estimulación durante más de 4 horas, en este caso, 24 horas (grupos 8, 12 y 16), parece disminuir la actividad de la ruta de señalización celular de NFkB, que se espera que se debiera a oscilaciones asincrónicas de NFkB que, para tiempos de estimulación más largos, dan como resultado una actividad de la ruta de señalización celular neta de NFkB amortiguada (véase, por ejemplo, D.E. Nelson et al., "Oscillations in NF-kB Signaling Control the Dynamics of Gene Expression", Science, Vol. 306, N.° 5696, 2004, páginas 704 a 708). El modelo que usa la lista de genes diana curada por evidencia muestra una actividad de la ruta de señalización celular de NFkB casi completamente amortiguada en las muestras de 24 horas, mientras que los modelos que usan la lista corta de 19 genes diana, la lista corta de 13 genes diana y la lista corta de 7 genes diana muestran una disminución menos fuerte de la actividad de la ruta de señalización celular de NFkB en las muestras de 24 horas. Se predijo correctamente que todas las muestras de control sin estimulación de TNFa (grupos 1 a 4) tenían una ruta de señalización celular de NFkB pasiva en los cuatro modelos. No parecía haber tanta diferencia en la actividad de la ruta de señalización celular como resultado del aumento de la concentración de TNFa como es evidente en la estimulación de 2 y 4 horas; aparentemente, todas las concentraciones probadas en este experimento fueron suficientes para tener una actividad de la ruta de señalización celular de NFkB en toda regla, incluso la concentración más baja. (Leyenda: 1 - Sin TNFa (0,5 h); 2 - Sin TNFa (2 h); 3 - Sin TNFa (4 h); 4 - Sin TNFa (24 h); 5 - TNFa bajo (0,5 h); 6 - TNFa bajo (2 h); 7 - TNFa bajo (4 h); 8 - TNFa bajo (24 h); 9 -TNFa medio (0,5 h); 10 - TNFa medio (2 h); 11 - TNFa medio (4 h); 12 - TNFa medio (24 h); 13 - TNFa alto (0,5 h); 14 - TNFa alto (2 h); 15 - TNFa alto (4 h); 16 - TNFa alto (24 h))
La Figura 12 muestra las predicciones de la actividad de la ruta de señalización celular de NFkB del modelo de red bayesiana a modo de ejemplo entrenado usando la lista curada por evidencia de genes diana (véase la Tabla 1) para células monocíticas de THP-1. En el diagrama, el eje vertical indica las probabilidades de que el elemento TF esté "presente" respecto a "ausente", que corresponde a que la ruta de señalización celular de NFkB esté activa respecto a inactiva, en donde los valores por encima del eje horizontal corresponden a que el elemento TF es más probable que esté "presente"/activo y los valores por debajo del eje horizontal indican que las probabilidades de que el elemento Tf esté "ausente"/inactivo son mayores que las probabilidades de que esté "presente"/activo. Se sabe que la línea celular THP-1 expresa la actividad de la ruta de señalización celular de NFkB tras la estimulación con agentes que inducen la respuesta inmunitaria tales como el lipopolisacárido (LPS). Se predice que la actividad de la ruta de señalización celular de NFkB en estas células monocíticas será baja sin estimulación con LPS (grupo 1). Tras la estimulación de estas células con LPS, se amplifica la actividad de la ruta de señalización celular de NFkB (grupo 2). Se ha informado que la coenzima Q10 (CoQ10) tiene efectos antiinflamatorios, sin embargo, se informó que el efecto sobre la actividad de la ruta de señalización celular de NFkB es limitado (véase, por ejemplo, C. Schmelzer y F. Doring, "Identification of LPS-inducible genes down-regulated by ubiquinone in human THP-1 monocytes", Biofactors, Vol. 36, N.° 3, 2010, páginas 222 a 228). Esto también se refleja en las actividades de la ruta de señalización celular de NFkB de alta predicción en las células THP-1 tratadas con CoQ10 y estimuladas con LPS (grupo 3). (Leyenda: 1 - Sin LPS; 2 - Estimulación con LPS; 3 - Estimulación con LPS + coenzima Q10)
Las Figuras 13 a 16 muestran las predicciones de la actividad de la ruta de señalización celular de NFkB de los modelos de redes bayesianas a modo de ejemplo entrenados usando la lista curada por evidencia de genes diana, la lista corta de 19 genes diana, la lista corta de 13 genes diana y la lista corta de 7 genes diana (véanse las Tablas 1 a 4), respectivamente, para muestras de colon de GSE4183. En los diagramas, el eje vertical indica las probabilidades de que el elemento TF esté "presente" respecto a "ausente", que corresponde a que la ruta de señalización celular de NFkB esté activa respecto a inactiva, en donde los valores por encima del eje horizontal corresponden a que el elemento TF es más probable que esté "presente"/activo y los valores por debajo del eje horizontal indican que las probabilidades de que el elemento TF esté "ausente"/inactivo son mayores que las probabilidades de que esté "presente"/activo. La mayoría de las muestras normales (grupo 1) se predijeron con razón con una baja probabilidad de actividad de la ruta de señalización celular de NFkB mediante el modelo que usa la lista de genes diana curada por evidencia, sin embargo, la actividad de la ruta de señalización celular para muestras normales parece ser más alta de lo esperado de otros conjuntos de datos en la lista corta de 19 genes diana, la lista corta de 13 genes diana y la lista corta de 7 genes diana. Por otro lado, los cuatro modelos predijeron que todas las muestras de enfermedad inflamatoria intestinal (IBD) (grupo 2) tenían una ruta de señalización celular de NFkB activa significativamente más alta que las muestras normales, que es como se esperaba debido al estado inflamado del colon en estos pacientes y la ruta de señalización celular de NFkB que se activa como resultado de la inflamación. Además, de los cuatro modelos se desprende claramente que la ruta de señalización celular de NFkB es más activa en los carcinomas colorrectales (CCR) más avanzados (grupo 4) en comparación con los adenomas benignos (grupo 2), lo que podría ser el resultado de la progresión del tumor a un tumor más maligno que resulta en más mutaciones, inflamación como resultado del tumor avanzado o infiltración de glóbulos blancos como resultado de la respuesta inmunitaria a los cánceres en etapa avanzada. Potencialmente, la puntuación de actividad de la ruta de señalización celular de NFkB podría usarse para predecir la probabilidad de que un adenoma progrese y se vuelva maligno. (Leyenda: 1 - Colon normal; 2 - IBD; 3 -Adenoma; 4 - CRC)
La Figura 17 muestra las predicciones de la actividad de la ruta de señalización celular de NFkB del modelo de red bayesiana a modo de ejemplo entrenado usando la lista curada por evidencia de genes diana (véase la Tabla 1) para líneas celulares de cáncer de mama de GSE10890. En el diagrama, el eje vertical indica las probabilidades de que el elemento TF esté "presente" respecto a "ausente", que corresponde a que la ruta de señalización celular de NFkB esté activa respecto a inactiva, en donde los valores por encima del eje horizontal corresponden a que el elemento TF es más probable que esté "presente"/activo y los valores por debajo del eje horizontal indican que las probabilidades de que el elemento TF esté "ausente"/inactivo son mayores que las probabilidades de que esté "presente"/activo. Algunas de las líneas celulares de cáncer de mama con una ruta aún desconocida que impulsa la supervivencia y la proliferación celular (grupos 1 y 2) se identificaron teniendo una ruta de señalización celular de NFkB aberrantemente activa, que puede ser la causa de la supervivencia y la proliferación celulares. En el tercer grupo que se identificó previamente teniendo una ruta de señalización celular Wnt activa (véase la solicitud de patente internacional publicada WO 2013/011479 A2 "Assessment of cellular signaling pathway activity using probabilistic modeling of target gene expression") no se encontró ninguna muestra de ruta de señalización de NFkB activa. (Leyenda: 1 y 2 - Líneas celulares dirigidas por rutas de señalización celular desconocidas; 3: Líneas celulares dirigidas por la ruta de señalización celular de Wnt)
La Figura 18 muestra las predicciones de la actividad de la ruta de señalización celular de NFkB del modelo de red bayesiana a modo de ejemplo entrenado usando la lista curada por evidencia de genes diana (véase la Tabla 1) para muestras de ovario de GSE20565. En el diagrama, el eje vertical indica las probabilidades de que el elemento TF esté "presente" respecto a "ausente", que corresponde a que la ruta de señalización celular de NFkB esté activa respecto a inactiva, en donde los valores por encima del eje horizontal corresponden a que el elemento TF es más probable que esté "presente"/activo y los valores por debajo del eje horizontal indican que las probabilidades de que el elemento Tf esté "ausente"/inactivo son mayores que las probabilidades de que esté "presente"/activo. La fracción de muestras activas de la ruta de señalización celular de NFkB predicha es significativamente más alta en los cánceres primarios (grupos 1 y 2) en comparación con la metástasis de mama en el ovario (grupos 3 y 4), p = 6,0e-5 (prueba exacta de Fisher). La inflamación crónica se ha asociado al inicio y el avance del tumor. Se ha demostrado que los procesos inflamatorios recurrentes en los ovarios debidos a la ovulación, la endometriosis y las infecciones pélvicas se correlacionan con los tumores activos de la ruta de señalización celular de NFkB (véase, por ejemplo, Alvero A.B., "Recent insights into the role of NF-kappaB in ovarian carcinogenesis", Genome Medicine, Vol. 2, N.° 8, 2010, página 56, y Guo R.X. et al., "Increased staining for phosphorylated AKT and nuclear factor-kappaB p65 and their relationship with prognosis in epithelial ovarian cancer", Pathology International, Vol. 58, N.° 12, 2008, páginas 746 a 756). En el ovario, la carcinogénesis se ha relacionado con procesos inflamatorios, tales como la ovulación repetida, endometriosis e infecciones pélvicas, posiblemente dando como resultado una mayor fracción de tumores activos de la ruta de señalización celular de NFkB que se originan en el ovario en comparación con la mama. (Leyenda: 1 -Carcinoma primario de ovario; 2 - Carcinoma ovárico primario plausible; 3 - Metástasis de mama en ovario; 4 -Metástasis de mama plausible en el ovario)
La Figura 19 muestra las predicciones de la actividad de la ruta de señalización celular de NFkB del modelo de red bayesiana a modo de ejemplo entrenado usando la lista curada por evidencia de genes diana (véase la Tabla 1) para muestras de cáncer de mama de E-MTAB-1006. En el diagrama, el eje vertical indica las probabilidades de que el elemento TF esté "presente" respecto a "ausente", que corresponde a que la ruta de señalización celular de NFkB esté activa respecto a inactiva, en donde los valores por encima del eje horizontal corresponden a que el elemento TF es más probable que esté "presente"/activo y los valores por debajo del eje horizontal indican que las probabilidades de que el elemento TF esté "ausente"/inactivo son mayores que las probabilidades de que esté "presente"/activo. El promedio de la razón de probabilidades logit NFkB es significativamente mayor en las muestras de cáncer de mama inflamatorio (IBC) (grupo 1) en comparación con los cánceres de mama no inflamados (nlBC) (grupo 2), p <0,01 (prueba t de dos muestras). Es probable que esto sea un reflejo del alto estado inflamatorio en IBC en comparación con nlBC. Sin embargo, las actividades de la ruta de señalización celular de NFkB predichas en ambos grupos se superponen en gran medida, lo que hace que una clasificación clara de IBC y nlBC basada en la actividad de la ruta de señalización celular de NFkB en el estado actual del modelo sea engorrosa. (Leyenda: 1 - Cáncer de mama inflamatorio; 2 - Cáncer de mama no inflamatorio)
La Figura 20 ilustra una supervivencia global de 272 pacientes de glioma (GSE16011) representado en un gráfico de Kaplan-Meier, en donde se emplea el modelo de red bayesiana a modo de ejemplo entrenado usando la lista de genes diana curada por evidencia (véase la Tabla 1). En el diagrama, el eje vertical indica la supervivencia global como una fracción del grupo de pacientes y el eje horizontal indica el tiempo en años. El gráfico indica que un elemento TF NFkB activo (indicado por la pendiente más pronunciada de la curva) es un marcador de pronóstico de una peor supervivencia global. (El grupo de pacientes con un elemento de TF NFkB activo predicho consistió en 113 pacientes (línea continua), mientras que el grupo de pacientes con un elemento TF NFkB pasivo predicho consistió en 159 pacientes (línea de puntos)). El valor pronóstico del nivel de actividad del elemento TF NFkB también se demuestra en el cociente de riesgo de la probabilidad predicha de actividad de NFkB: 1,83 (CI del 95 %: 1,34 - 2,49, p = 7,2e-5).
Además del modelo de red bayesiana a modo de ejemplo descrito anteriormente, se usó un modelo lineal a modo de ejemplo para modelar el programa transcripcional de la ruta de señalización celular de NFkB de una manera sencilla. La estructura del modelo correspondía a la que se muestra en la Figura 3 de la solicitud de patente internacional publicada WO 2014/102668 A2 ("Assessment of cellular signaling pathway activity using linear combination(s) of target gene expressions"). Más específicamente, el modelo lineal a modo de ejemplo consistió en un nodo TF, una capa de expresión génica diana y una capa de niveles de expresión de ARNm e hizo uso de datos de expresión continua, todos los genes diana de la lista de genes diana curada por evidencia (véase la Tabla 1) con todos los conjuntos de sondas incluidos y sin el uso de un pseudorecuento. El entrenamiento del modelo se realizó con las mismas muestras de entrenamiento activo y pasivo de GSE12195 y abarcó el cálculo de los pesos de las conexiones entre los niveles de expresión de los genes diana, aquí representado por medio de intensidades del conjunto de sondas, y los nodos de genes diana usando el método de "probabilidades de registro suave" como se describe en el presente documento y, posteriormente, la puntuación de actividad del complejo de factores de transcripción se calculó mediante la suma de la puntuación de expresión de genes diana calculada multiplicada por 1 o -1 para genes diana positiva o negativamente regulados, respectivamente.
La Figura 21 muestra los resultados de entrenamiento del modelo lineal a modo de ejemplo basado en la lista de genes diana curada por evidencia (véase la Tabla 1). En el diagrama, el eje vertical indica la puntuación de la actividad, en donde los valores positivos corresponden a una ruta de señalización celular de NFkB activa y los valores negativos corresponden a una ruta de señalización celular de NFkB pasiva. El DLBCL de linfocitos B activados (ABC) (grupo 1) y el normal (grupo 7) se usaron como muestras de entrenamiento activo y pasivo, respectivamente. Todas las muestras de entrenamiento se clasificaron correctamente; se predijo que todas las muestras a Bc tenían una ruta de señalización celular de NFkB activa, mientras que se predijo que las muestras normales tenían una ruta de señalización celular de NFkB pasiva. Dentro del mismo conjunto de datos, se predijo que todas las demás muestras de linfoma y líneas celulares y DLBCL (grupos 2 a 4, 8), excepto una, eran NFkB activas, similar al modelo de red bayesiana que usa la lista de genes diana curada por evidencia (figura 3), lo cual es plausible dada la evidencia de la bibliografía analizada en el presente documento. Se predice correctamente que los linfocitos B de memoria sanos, no estimulados y los linfocitos B vírgenes (grupos 5 y 6) carecen de actividad NFkB. (Leyenda: 1 - ABC DLBCL; 2 - Línea celular linfoblastoide; 3 - Linfoma folicular; 4 - GCB DLBCL; 5 - Linfocitos B de memoria; 6 - Linfocitos B vírgenes; 7 - Normal; 8 - Subtipo desconocido de DLBCL)
La Figura 22 muestra las predicciones de la actividad de la ruta de señalización celular de NFkB del modelo lineal a modo de ejemplo entrenado usando la lista de genes diana curada por evidencia (véase la Tabla 1) para muestras de líneas celulares epiteliales bronquiales humanas normales (NHBE) de E-MTAB-1312, que se estimularon con diferentes concentraciones de TNFa para diferentes tiempos de estimulación. En el diagrama, el eje vertical indica la puntuación de la actividad, en donde los valores positivos corresponden a una ruta de señalización celular de NFkB activa y los valores negativos corresponden a una ruta de señalización celular de NFkB pasiva. Las líneas celulares NHBE no se estimularon o se estimularon con diferentes concentraciones de TNFa para diferentes tiempos. Se predice correctamente que todas las células sanas no estimuladas (grupos 1 a 4) tienen una ruta de señalización celular de NFkB pasiva. Se predice que una estimulación con todas las concentraciones de TNFa durante solo 0,5 h serán demasiado cortas para que la ruta de señalización celular de NFkB se active (grupos 5, 9 y 13), similar al modelo de red bayesiana que usa la lista de genes diana curada por evidencia (figura 8), mientras que los tiempos de estimulación de 2 a 24 horas dieron como resultado una ruta de señalización celular de NFkB activa. La disminución de la actividad de la ruta de señalización celular de NFkB después de 4 horas observada con el modelo de red bayesiana, especialmente usando la lista de genes diana curada por evidencia (véase la Figura 8) no pudo reproducirse con el modelo lineal a modo de ejemplo entrenado. (Leyenda: 1 - Sin TNFa (0,5 h); 2 - Sin TNFa (2 h); 3 - Sin TNFa (4 h); 4 - Sin TNFa (24 h); 5 - TNFa bajo (0,5 h); 6 - TNFa bajo (2 h); 7 - TNFa bajo (4 h); 8 - TNFa bajo (24 h); 9 - TNFa medio (0,5 h); 10 - TNFa medio (2 h); 11 - TNFa medio (4 h); 12 - TNFa medio (24 h); 13 - TNFa alto (0,5 h); 14 - TNFa alto (2 h); 15 - TNFa alto (4 h); 16 - TNFa alto (24 h))
La Figura 23 muestra las predicciones de la actividad de la ruta de señalización celular de NFkB del modelo lineal a modo de ejemplo entrenado usando la lista curada por evidencia de genes diana (véase la Tabla 1) para muestras de colon de GSE4183. En el diagrama, el eje vertical indica la puntuación de la actividad, en donde los valores positivos corresponden a una ruta de señalización celular de NFkB activa y los valores negativos corresponden a una ruta de señalización celular de NFkB pasiva. Se predijo que la mayoría de las muestras normales (grupo 1) tenía una baja actividad de la ruta de señalización celular de NFkB, aunque con puntuaciones de actividad más altas de lo esperado de otros conjuntos de datos. En comparación con las muestras normales, se predijo que todas las muestras de enfermedad inflamatoria del intestino (grupo 2) tendrían una puntuación de actividad de NFkB más alta en comparación con las muestras normales, lo cual es muy razonable considerando el estado inflamado del colon en estos pacientes que activa la ruta de señalización celular de NFkB como una de las respuestas inflamatorias. Además, está claro que las muestras en las muestras de adenoma (grupo 3) son en promedio más bajas que los carcinomas colorrectales más avanzados (CRC, grupo 4), lo que podría explicarse parcialmente por la progresión del tumor a un tumor más maligno que da como resultado más mutaciones, inflamación como resultado del tumor avanzado o infiltración de glóbulos blancos como resultado de la respuesta inmunitaria a los cánceres en etapa avanzada. (Leyenda: 1 - Colon normal; 2 - IBD; 3 - Adenoma; 4 - CRC)
En lugar de aplicar el modelo matemático, por ejemplo, el modelo de red bayesiana a modo de ejemplo, en datos de entrada de ARNm provenientes de micromatrices o secuenciación de ARN, puede ser beneficioso en aplicaciones clínicas desarrollar ensayos específicos para realizar las mediciones de la muestra, por ejemplo, en una plataforma integrada que usa qPCR para determinar los niveles de ARNm de genes diana. Las secuencias de ARN/ADN de los genes diana desvelados pueden usarse después para determinar qué cebadores y sondas seleccionar en dicha plataforma.
La validación de dicho ensayo dedicado puede realizarse usando el modelo matemático basado en micromatrices como modelo de referencia y verificando si el ensayo desarrollado da resultados similares en un conjunto de muestras de validación. Junto a un ensayo dedicado, esto también puede realizarse para construir y calibrar modelos matemáticos similares usando datos de secuenciación de ARNm como medidas de entrada.
El conjunto de genes diana que mejor indican la actividad de la ruta de señalización celular específica, basado en una investigación basada en secuenciación de micromatrices/ARN usando el modelo matemático, por ejemplo, el modelo de red bayesiana a modo de ejemplo, puede traducirse en un ensayo de PCR cuantitativa múltiplex para realizar en una muestra y/o un ordenador para interpretar las medidas de expresión y/o inferir la actividad de la ruta de señalización celular de NFkB. Para desarrollar una prueba de este tipo (por ejemplo, una prueba aprobada por la FDA o una prueba exenta de CLIA en un laboratorio de servicio central) para la actividad de la ruta de señalización celular, se requiere el desarrollo de un kit de prueba normalizado, que debe validarse clínicamente en ensayos clínicos para obtener la aprobación regulatoria.
La presente invención se refiere a un método que comprende inferir la actividad de una ruta de señalización celular de NFkB basada al menos en los niveles de expresión de seis o más genes diana de la ruta de señalización celular de NFkB medidos en una muestra. La presente invención se refiere además a un aparato que comprende un procesador digital configurado para realizar un método tal, un medio de almacenamiento no transitorio que almacena instrucciones que son ejecutables por un dispositivo de procesamiento digital para realizar un método tal, y un programa informático que comprende medios de código de programa para hacer que un dispositivo de procesamiento digital realice un método tal.
El método puede usarse, por ejemplo, en el diagnóstico de una actividad (anormal) de la ruta de señalización celular de NFkB, en el pronóstico basado en la actividad inferida de la ruta de señalización celular de NFkB, en la inscripción en un ensayo clínico basado en la actividad inferida de la ruta de señalización celular de NFkB, en la selección de la prueba o pruebas posteriores que se realizarán, en la selección de pruebas de diagnóstico complementarias, en sistemas de apoyo a la toma de decisiones clínicas, o similares. A este respecto, se hace referencia a la solicitud de patente internacional publicada WO 2013/011479 A2 ("Assessment of cellular signaling pathway activity using probabilistic modeling of target gene expression"), a la solicitud de patente internacional publicada WO 2014/102668 A2 ("Assessment of cellular signaling pathway activity using linear combination(s) of target gene expressions") y a Verhaegh W. et al., "Selection of personalized patient therapy through the use of knowledge-based computational models that identify tumor-driving signal transduction pathways", Cancer Research, Vol. 74, N.° 11, 2014, páginas 2936 a 2945, que describen estas aplicaciones con más detalle.
Ejemplo 4: Comparación de la lista curada de evidencias con una amplia lista de bibliografía
La lista de genes diana de la ruta de señalización celular de NFkB construida basándose en la evidencia de la bibliografía siguiendo el procedimiento como se describe en el presente documento ("lista curada por evidencia de genes diana", véase la Tabla 1) se compara aquí con una "lista amplia de la bibliografía" de genes diana putativos de la ruta de señalización celular de NFkB construida sin seguir el procedimiento mencionado anteriormente. La lista alternativa es una compilación de genes atribuidos a responder a la actividad de la ruta de señalización celular de NFkB proporcionada dentro del Metacore de Thomson-Reuters (consultado por última vez el 6 de septiembre de 2013). Esta base de datos fue consultada para genes que están transcripcionalmente regulados directamente en dirección 3' de la familia de proteínas NFkB, es decir, NFKB1 o p50/p105, NFKB2 o p52/p100, RELA o p65, REL y RELB. Esta consulta dio como resultado 343 genes únicos. Se realizó una selección adicional basada en el número de referencias de publicación que apoyan la regulación transcripcional atribuida del gen respectivo por la familia NFkBSMAD. Los genes que tenían diez o más referencias se seleccionaron para la amplia lista de bibliografía. En otras palabras, no se realizó la curación manual de las referencias ni el cálculo de una puntuación de evidencia basada en la evidencia experimental. Este procedimiento dio como resultado 32 genes, véase la Tabla 5. La expresión de los genes se midió mediante 56 conjuntos de sondas en la plataforma de micromatrices Affymetrix HG-U133Plus2.0 que se seleccionaron usando el complemento Bioconductor de R y un conjunto de sondas añadido manualmente para DEFB4A, véase la Tabla 5.
Tabla 5: "Lista de bibliografía amplia" de genes diana putativos de la ruta de señalización celular de NFkB usada en los modelos de ruta de señalización celular de NFkB y conjuntos de sondas asociadas usados para medir el nivel de x r i n ARNm l n .
Figure imgf000020_0001
continuación
Figure imgf000021_0001
Posteriormente se construyó un modelo de red bayesiana a modo de ejemplo usando el procedimiento que se explica en el presente documento. De manera similar a la descripción del modelo de la ruta de señalización celular de NFkB basada en la lista curada de evidencia, las tablas de probabilidad condicional de los bordes entre conjuntos de sondas y sus respectivos genes diana putativos de este modelo, incluida la amplia lista de bibliografía, se entrenaron usando datos procesados con fRMA de GSE12195. Los resultados de entrenamiento se representan en la Figura 24. En el diagrama, el eje vertical indica las probabilidades de que el elemento TF esté "presente" respecto a "ausente", que corresponde a que la ruta de señalización celular de NFkB esté activa respecto a inactiva, en donde los valores por encima del eje horizontal corresponden a que el elemento TF es más probable que esté "presente"/activo y los valores por debajo del eje horizontal indican que las probabilidades de que el elemento TF esté "ausente"/inactivo son mayores que las probabilidades de que esté "presente"/activo. El DLBCL de linfocitos B activados (ABC) (grupo 1) se usó como muestras de entrenamiento activo y las muestras normales (grupo 7) se usaron como muestras de entrenamiento pasivo. Los resultados del entrenamiento que se muestran en la Figura 24 muestran una clara separación entre las muestras de entrenamiento pasivo (grupo 7) y activo (grupo 1) como se esperaba. Dentro del mismo conjunto de datos, todas las demás muestras de linfoma y líneas celulares y DLBCL (grupos 2 a 4, 8) se predijeron como NFkB activo, lo cual es plausible dada la evidencia de la bibliografía analizada en el presente documento. Se predice correctamente que los linfocitos B de memoria sanos, no estimulados y los linfocitos B vírgenes (grupos 5 y 6) tienen una carencia de actividad de la ruta de señalización celular de NFkB. (Leyenda: 1 - ABC DLBCL; 2 - Línea celular linfoblastoide; 3 - Linfoma folicular; 4 - GCB DLBCL; 5 - Linfocitos B de memoria; 6 - Linfocitos B vírgenes; 7 - Normal; 8 - Subtipo desconocido de DLBCL).
A continuación, se probó el modelo de red bayesiana a modo de ejemplo entrenado basado en la amplia lista de bibliografía en una serie de conjuntos de datos.
La Figura 25 muestra las predicciones de la actividad de la ruta de señalización celular de NFkB del modelo de red bayesiana a modo de ejemplo entrenado usando la amplia lista de la bibliografía de genes diana putativos de la ruta de señalización celular de NFkB (véase la Tabla 5) para muestras de líneas celulares epiteliales bronquiales humanas normales (NHBE) de E-MTAB-1312, que se estimularon con diferentes concentraciones de TNFa para diferentes tiempos de estimulación. En el diagrama, el eje vertical indica las probabilidades de que el elemento TF esté "presente" respecto a "ausente", que corresponde a que la ruta de señalización celular de NFkB esté activa respecto a inactiva, en donde los valores por encima del eje horizontal corresponden a que el elemento TF es más probable que esté "presente"/activo y los valores por debajo del eje horizontal indican que las probabilidades de que el elemento TF esté "ausente"/inactivo son mayores que las probabilidades de que esté "presente"/activo. Se predice correctamente que todas las células sanas no estimuladas hasta 24 horas (grupos 1 a 3) tienen una ruta de señalización celular de NFkB pasiva. La falta de estimulación durante 24 horas dio como resultado una activación inesperada de la predicción de la ruta de señalización celular de NFkB. Se predice que una estimulación con todas las concentraciones de TNFa para solo 0,5 h por el modelo bayesiano de la bibliografía amplia es también muy corta para que la ruta de señalización celular de NFkB se active (grupos 5, 9 y 13), mientras que los tiempos de estimulación de 2 a 24 horas dieron como resultado una ruta de señalización celular de NFkB activa (grupos 5 a 8, 9 a 12 y 13 a 15). La disminución de la actividad de la ruta de señalización celular de NFkB después de 4 horas observada con el modelo de red bayesiana que usa la lista de genes diana curada por evidencia (véase la Figura 8) no se reprodujo con el modelo de red bayesiana de la bibliografía amplia entrenado. (Leyenda: 1 - Sin TNFa (0,5 h); 2 - Sin TNFa (2 h); 3 - Sin TNFa (4 h); 4 - Sin TNFa (24 h); 5 - TNFa bajo (0,5 h); 6 - TNFa bajo (2 h); 7 - TNFa bajo (4 h); 8 - TNFa bajo (24 h); 9 - TNFa medio (0,5 h); 10 - TNFa medio (2 h); 11 - TNFa medio (4 h); 12 - TNFa medio (24 h); 13 - TNFa alto (0,5 h); 14 - TNFa alto (2 h); 15 - TNFa alto (4 h); 16 - TNFa alto (24 h))
La Figura 26 muestra las predicciones de la actividad de la ruta de señalización celular de NFkB del modelo de red bayesiana a modo de ejemplo entrenado usando la amplia lista de la bibliografía de genes diana putativos de la ruta de señalización celular de NFkB (véase la Tabla 5) para muestras de colon de GSE4183. En el diagrama, el eje vertical indica las probabilidades de que el elemento TF esté "presente" respecto a "ausente", que corresponde a que la ruta de señalización celular de NFkB esté activa respecto a inactiva, en donde los valores por encima del eje horizontal corresponden a que el elemento TF es más probable que esté "presente"/activo y los valores por debajo del eje horizontal indican que las probabilidades de que el elemento TF esté "ausente"/inactivo son mayores que las probabilidades de que esté "presente"/activo. El modelo de red bayesiano de la bibliografía general predice que todas menos una muestra de adenoma tienen una ruta de señalización celular de NFkB activa, que no se espera especialmente que sea el caso en muestras de colon normales, sanas (grupo 1). (Leyenda: 1 - Colon normal; 2 - IBD; 3 - Adenoma; 4 - CRC)
Ejemplo 5: Cebadores y sondas para su uso en un kit
Los cebadores y sondas de PCR preferidos para su uso en un kit se enumeran en la siguiente Tabla 6. Los cebadores de PCR para cada gen se denominan Directo (For, del inglés Forward) e Inverso (Rev, del inglés Reverse) y las sondas para la detección de los productos de PCR para cada gen se marcan como Probe (sonda en inglés). En una realización no limitante, las sondas enumeradas en la Tabla 6 están marcadas con un colorante FAM 5' con un inactivador ZEN interno y un inactivador fluorescente negro Iowa 3' (IBFQ).
Tabla 6: Ejemplo no limitante de cebadores y sondas para un kit para medir la expresión génica de genes diana
NFkB.
Figure imgf000022_0001
Preferentemente,
un kit incluye uno o más componentes para medir los niveles de expresión de genes de control, en donde el uno o más componentes incluyen cebadores y sondas de PCR para al menos uno de los genes de control enumerados en la Tabla 7. Los cebadores de PCR para cada gen se denominan Directo (F, del inglés Forward) e Inverso (R, del inglés Reverse) y las sondas para la detección de los productos de PCR para cada gen se marcan como Probe (sonda en inglés) (P FAM). En una realización no limitante, las sondas enumeradas en la Tabla 7 están marcadas con un colorante FAM 5' con un inactivador ZEN interno y un inactivador fluorescente negro Iowa 3' (IBFQ).
Tabla 7: Secuencias de oli o ara los controles
Figure imgf000022_0002
continuación
Figure imgf000023_0001
LISTADO DE SECUENCIAS:
Seq. N.°: Gen:
Seq. 1 BCL2
Seq. 2 BCL2L1 Seq. 3 BIRC3 Seq. 4 CCL2 Seq. 5 CCL3 Seq. 6 CCL4 Seq. 7 CCL5 Seq. 8 CCL20 Seq. 9 CCL22

Claims (8)

REIVINDICACIONES
1. Un método que comprende:
inferir la actividad de una ruta de señalización celular de NFkB basada al menos en los niveles de expresión de siete genes diana de la ruta de señalización celular de NFkB medidos en una muestra, en donde la inferencia comprende:
determinar un nivel de un elemento de factor de transcripción (TF) NFkB en la muestra, controlando el elemento TF NFkB la transcripción de los siete genes diana de la ruta de señalización celular de NFkB, basándose la determinación al menos en parte en la evaluación de un modelo matemático que relaciona los niveles de expresión de los siete genes diana de la ruta de señalización celular de NFkB con el nivel del elemento TF NFkB, en donde los siete genes diana son CCL5, CXCL2, ICAM1, IL6, IL8, NFKBIA y TNFAIP2;
inferir la actividad de la ruta de señalización celular de NFkB basada en el nivel determinado del elemento TF NFkB en la muestra,
en donde la inferencia se realiza mediante un dispositivo de procesamiento digital usando el modelo matemático.
2. El método de la reivindicación 1, que comprende además:
determinar si la ruta de señalización celular de NFkB está funcionando de forma anormal basándose en la actividad inferida de la ruta de señalización celular de NFkB.
3. El método de la reivindicación 2, que comprende además:
recomendar la prescripción de un medicamento que corrija el funcionamiento anormal de la ruta de señalización celular de NFkB,
en donde la recomendación se realiza solo si se determina que la ruta de señalización celular de NFkB está funcionando de forma anormal basándose en la actividad inferida de la ruta de señalización celular de NFkB.
4. El método de cualquiera de las reivindicaciones 1 a 3, en donde el método se usa en al menos una de las siguientes actividades:
diagnóstico basado en la actividad inferida de la ruta de señalización celular de NFkB;
pronóstico basado en la actividad inferida de la ruta de señalización celular de NFkB;
prescripción de fármacos basada en la actividad inferida de la ruta de señalización celular de NFkB; predicción de la efectividad de fármacos basada en la actividad inferida de la ruta de señalización celular de NFkB; predicción de efectos adversos basada en la actividad inferida de la ruta de señalización celular de NFkB; monitorización de la efectividad de fármacos;
desarrollo de fármacos;
desarrollo de ensayos;
investigación de rutas;
estadificación del cáncer;
inscripción en un ensayo clínico basado en la actividad inferida de la ruta de señalización celular de NFkB; selección de la prueba posterior a realizar; y
selección de pruebas de diagnóstico complementario.
5. El método de cualquiera de las reivindicaciones 1 a 4, en donde el modelo matemático es un modelo probabilístico, preferentemente un modelo de red bayesiana, basado al menos en parte en probabilidades condicionales que relacionan el elemento TF NFkB y los niveles de expresión de los siete genes diana de la ruta de señalización celular de NFkB medidos en la muestra, o en donde el modelo matemático puede basarse al menos en parte en una o más combinación o combinaciones lineales de los niveles de expresión de los siete genes diana de la ruta de señalización celular de NFkB medidos en la muestra.
6. Un kit para medir los niveles de expresión de siete genes diana de la ruta de señalización celular de NFkB en una muestra, que comprende:
cebadores de reacción en cadena de la polimerasa dirigidos a los siete genes diana de NFkB,
sondas dirigidas a los siete genes diana de NFkB, y
opcionalmente, un aparato que comprende un procesador digital configurado para realizar el método de cualquiera de las reivindicaciones 1 a 5 o un medio de almacenamiento no transitorio que almacena instrucciones que son ejecutables por un dispositivo de procesamiento digital para realizar el método de cualquiera de las reivindicaciones 1 a 5,
en donde los siete genes diana de NFkB son CCL5, CXCL2, ICAM1, IL6, IL8, NFKBIA y TNFAIP2.
7. Un kit para medir los niveles de expresión de siete genes diana de la ruta de señalización celular de NFkB en una muestra, que comprende:
uno o más componentes para determinar los niveles de expresión de los siete genes diana de la ruta de señalización celular de NFkB y
un aparato que comprende un procesador digital configurado para realizar el método de cualquiera de las reivindicaciones 1 a 5 o un medio de almacenamiento no transitorio que almacena instrucciones que son ejecutables por un dispositivo de procesamiento digital para realizar el método de cualquiera de las reivindicaciones 1 a 5,
en donde el uno o más componentes se seleccionan preferentemente del grupo que consiste en: un chip de micromatrices, un anticuerpo, una pluralidad de sondas, secuenciación de ARN y un conjunto de cebadores y en donde los siete genes diana de la ruta de señalización celular de NFkB son CCL5, CXCL2, ICAM1, IL6, IL8, NFKBIA y TNFAIP2.
8. Uso del kit de la reivindicación 6 o 7 para realizar el método de cualquiera de las reivindicaciones 1 a 5.
ES16753888T 2015-08-14 2016-08-12 Evaluación de la actividad de la ruta de señalización celular de NFkB usando modelos matemáticos de la expresión de genes diana Active ES2861400T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP15181029 2015-08-14
PCT/EP2016/069237 WO2017029215A1 (en) 2015-08-14 2016-08-12 Assessment of nfkb cellular signaling pathway activity using mathematical modelling of target gene expression

Publications (1)

Publication Number Publication Date
ES2861400T3 true ES2861400T3 (es) 2021-10-06

Family

ID=53938129

Family Applications (1)

Application Number Title Priority Date Filing Date
ES16753888T Active ES2861400T3 (es) 2015-08-14 2016-08-12 Evaluación de la actividad de la ruta de señalización celular de NFkB usando modelos matemáticos de la expresión de genes diana

Country Status (10)

Country Link
US (2) US11450409B2 (es)
EP (1) EP3334837B1 (es)
JP (1) JP7028763B2 (es)
CN (1) CN108138237B (es)
AU (1) AU2016309659A1 (es)
BR (1) BR112018002848A2 (es)
CA (1) CA2995520A1 (es)
DK (1) DK3334837T3 (es)
ES (1) ES2861400T3 (es)
WO (1) WO2017029215A1 (es)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3431582A1 (en) 2017-07-18 2019-01-23 Koninklijke Philips N.V. Cell culturing materials
EP3462348A1 (en) 2017-09-28 2019-04-03 Koninklijke Philips N.V. Bayesian inference
EP3462349A1 (en) * 2017-10-02 2019-04-03 Koninklijke Philips N.V. Assessment of notch cellular signaling pathway activity using mathematical modelling of target gene expression
WO2019068623A1 (en) 2017-10-02 2019-04-11 Koninklijke Philips N.V. DETERMINING THE FUNCTIONAL STATE OF TYPES OF IMMUNE CELLS AND AN IMMUNE RESPONSE
CN113841052A (zh) * 2018-10-18 2021-12-24 费森尤斯医疗保健控股公司 用于建模甲状旁腺功能和拟钙剂药物活性的技术
CN113785075A (zh) * 2019-05-03 2021-12-10 皇家飞利浦有限公司 高级别浆液性卵巢癌的预后方法
EP3812474A1 (en) 2019-10-22 2021-04-28 Koninklijke Philips N.V. Methods of prognosis in high-grade serous ovarian cancer
EP3739588A1 (en) 2019-05-13 2020-11-18 Koninklijke Philips N.V. Assessment of multiple signaling pathway activity score in airway epithelial cells to predict airway epithelial abnormality and airway cancer risk
EP3758005A1 (en) 2019-06-24 2020-12-30 Koninklijke Philips N.V. Identification of the cellular function of an active nfkb pathway
CN110779967B (zh) * 2019-09-18 2022-06-17 南京农业大学 一种基于传统玻碳电极的NF-κB电化学检测方法
EP3882363A1 (en) 2020-03-17 2021-09-22 Koninklijke Philips N.V. Prognostic pathways for high risk sepsis patients
EP3978628A1 (en) 2020-10-01 2022-04-06 Koninklijke Philips N.V. Prognostic pathways for viral infections
WO2021209567A1 (en) 2020-04-16 2021-10-21 Koninklijke Philips N.V. Prognostic pathways for viral infections
CN111606976A (zh) * 2020-05-26 2020-09-01 中国人民解放军军事科学院军事医学研究院 一种小肽及其在抑制阿片成瘾性和耐受性上的应用
EP3940704A1 (en) 2020-07-14 2022-01-19 Koninklijke Philips N.V. Method for determining the differentiation state of a stem cell
EP3960875A1 (en) 2020-08-28 2022-03-02 Koninklijke Philips N.V. Pcr method and kit for determining pathway activity
EP3965119A1 (en) 2020-09-04 2022-03-09 Koninklijke Philips N.V. Methods for estimating heterogeneity of a tumour based on values for two or more genome mutation and/or gene expression related parameter, as well as corresponding devices
EP3974540A1 (en) 2020-09-25 2022-03-30 Koninklijke Philips N.V. Method for predicting immunotherapy resistance
EP4015651A1 (en) 2020-12-17 2022-06-22 Koninklijke Philips N.V. Treatment prediction and effectiveness of anti-tnf alpha treatment in ibd patients
EP4039825A1 (en) 2021-02-09 2022-08-10 Koninklijke Philips N.V. Comparison and standardization of cell and tissue culture
JP2024514404A (ja) 2021-03-11 2024-04-02 コーニンクレッカ フィリップス エヌ ヴェ 高リスク敗血症患者のための予後経路
TW202340480A (zh) * 2021-11-23 2023-10-16 義大利商義大利藥品股份有限公司 檢測rna生物標記之方法

Family Cites Families (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6004761A (en) 1986-11-19 1999-12-21 Sanofi Method for detecting cancer using monoclonal antibodies to new mucin epitopes
US5436134A (en) 1993-04-13 1995-07-25 Molecular Probes, Inc. Cyclic-substituted unsymmetrical cyanine dyes
US5658751A (en) 1993-04-13 1997-08-19 Molecular Probes, Inc. Substituted unsymmetrical cyanine dyes with selected permeability
US6720149B1 (en) 1995-06-07 2004-04-13 Affymetrix, Inc. Methods for concurrently processing multiple biological chip assays
US5545531A (en) 1995-06-07 1996-08-13 Affymax Technologies N.V. Methods for making a device for concurrently processing multiple biological chip assays
US6146897A (en) 1995-11-13 2000-11-14 Bio-Rad Laboratories Method for the detection of cellular abnormalities using Fourier transform infrared spectroscopy
US6391550B1 (en) 1996-09-19 2002-05-21 Affymetrix, Inc. Identification of molecular sequence signatures and methods involving the same
NZ516848A (en) 1997-06-20 2004-03-26 Ciphergen Biosystems Inc Retentate chromatography apparatus with applications in biology and medicine
DE69823206T2 (de) 1997-07-25 2004-08-19 Affymetrix, Inc. (a Delaware Corp.), Santa Clara Verfahren zur herstellung einer bio-informatik-datenbank
US6953662B2 (en) 1997-08-29 2005-10-11 Human Genome Sciences, Inc. Follistatin-3
US6020135A (en) 1998-03-27 2000-02-01 Affymetrix, Inc. P53-regulated genes
US6884578B2 (en) 2000-03-31 2005-04-26 Affymetrix, Inc. Genes differentially expressed in secretory versus proliferative endometrium
AU2002245043B2 (en) 2000-11-16 2006-10-26 Bio-Rad Laboratories, Inc. Method for analyzing mass spectra
CA2438391A1 (en) 2001-02-16 2002-10-10 William E. Rich Method for correlating gene expression profiles with protein expression profiles
DK2261369T3 (da) 2002-03-13 2014-07-28 Genomic Health Inc Genekspressionsprofilering i biopsier af tumorvæv
US7097976B2 (en) 2002-06-17 2006-08-29 Affymetrix, Inc. Methods of analysis of allelic imbalance
JP4606879B2 (ja) 2002-11-15 2011-01-05 ジェノミック ヘルス, インコーポレイテッド Egfr陽性癌の遺伝子発現プロファイリング
US20040231909A1 (en) 2003-01-15 2004-11-25 Tai-Yang Luh Motorized vehicle having forward and backward differential structure
US20040180341A1 (en) 2003-03-07 2004-09-16 Brown University Transcriptional regulation of kinase inhibitors
DK2775000T3 (en) 2003-06-24 2017-02-13 Genomic Health Inc PREDICTION OF THE LIKELIHOOD OF CANCER RECIDENCE
ES2905579T3 (es) 2003-07-10 2022-04-11 Genomic Health Inc Algoritmo del perfil de expresión y prueba para el pronóstico de la recaída del cáncer de mama
CA2585571C (en) 2004-11-05 2020-01-21 Genomic Health, Inc. Predicting response to chemotherapy using gene expression markers
US7754861B2 (en) 2005-03-23 2010-07-13 Bio-Rad Laboratories, Inc. Method for purifying proteins
US20060234911A1 (en) 2005-03-24 2006-10-19 Hoffmann F M Method of reversing epithelial mesenchymal transition
WO2006124836A1 (en) 2005-05-13 2006-11-23 Duke University Gene expression signatures for oncogenic pathway deregulation
KR100806274B1 (ko) 2005-12-06 2008-02-22 한국전자통신연구원 멀티 쓰레디드 프로세서 기반의 병렬 시스템을 위한 적응형실행 방법
NZ569788A (en) 2006-01-11 2011-08-26 Genomic Health Inc RNA transcript of BGN as a gene expression markers for colorectal cancer prognosis
US7888019B2 (en) 2006-03-31 2011-02-15 Genomic Health, Inc. Genes involved estrogen metabolism
EP2002022A1 (en) 2006-04-11 2008-12-17 Bio-Rad Pasteur Hpv detection and quantification by real-time multiplex amplification
EP2639316A1 (en) 2007-05-11 2013-09-18 The Johns Hopkins University Biomarkers for melanoma
WO2008157459A2 (en) 2007-06-14 2008-12-24 The Regents Of The University Of Michigan Methods and systems for identifying molecular pathway elements
US20100273711A1 (en) 2007-09-28 2010-10-28 Anil Potti Individualized cancer treatments
CN101932938B (zh) 2007-11-30 2014-08-27 克雷特诊疗服务公司 作为标记物用于化学疗法的tle3
WO2009114836A1 (en) 2008-03-14 2009-09-17 Genomic Health, Inc. Gene expression markers for prediction of patient response to chemotherapy
WO2009124251A1 (en) 2008-04-03 2009-10-08 Sloan-Kettering Institute For Cancer Research Gene signatures for the prognosis of cancer
AU2009268659A1 (en) 2008-07-08 2010-01-14 Genomic Health, Inc. Gene expression profiling for predicting the survivability of prostate cancer subjects
CN105039523A (zh) 2008-11-17 2015-11-11 威拉赛特公司 用于疾病诊断的分子表达谱的方法和组合物
US8765383B2 (en) 2009-04-07 2014-07-01 Genomic Health, Inc. Methods of predicting cancer risk using gene expression in premalignant tissue
WO2011014697A1 (en) 2009-07-31 2011-02-03 The Translational Genomics Research Institute Methods of assessing a risk of cancer progression
US8451450B2 (en) 2009-09-14 2013-05-28 Bio-Rad Laboratories, Inc. Near real time optical phase conjugation
CN102859528A (zh) 2010-05-19 2013-01-02 加利福尼亚大学董事会 使用生物网络识别药物靶点的系统和方法
US8703736B2 (en) 2011-04-04 2014-04-22 The Translational Genomics Research Institute Therapeutic target for pancreatic cancer cells
WO2012154567A2 (en) 2011-05-06 2012-11-15 Albert Einstein College Of Medicine Of Yeshiva University Human invasion signature for prognosis of metastatic risk
US9458510B2 (en) 2011-06-27 2016-10-04 Mietamark Genetics, Inc. Signatures and determinants associated with prostate cancer progression and methods of use thereof
EP2549399A1 (en) 2011-07-19 2013-01-23 Koninklijke Philips Electronics N.V. Assessment of Wnt pathway activity using probabilistic modeling of target gene expression
US20140303133A1 (en) 2011-11-18 2014-10-09 Vanderbilt University Markers of Triple-Negative Breast Cancer And Uses Thereof
NZ627887A (en) 2012-01-31 2016-08-26 Genomic Health Inc Gene expression profile algorithm and test for determining prognosis of prostate cancer
DK2938745T3 (da) * 2012-12-26 2020-11-30 Koninklijke Philips Nv Vurdering af cellulær signalvejsaktivitet under anvendelse af lineær(e) kombination(er) af målgenekspressioner
EP2989211B1 (en) 2013-04-26 2018-06-13 Koninklijke Philips N.V. Medical prognosis and prediction of treatment response using multiple cellular signalling pathway activities
CN105492630A (zh) 2014-01-03 2016-04-13 皇家飞利浦有限公司 使用靶基因表达的数学建模评价pi3k细胞信号传导途径活性

Also Published As

Publication number Publication date
US20230260595A1 (en) 2023-08-17
EP3334837A1 (en) 2018-06-20
EP3334837B1 (en) 2020-12-16
BR112018002848A2 (pt) 2018-11-06
US11450409B2 (en) 2022-09-20
AU2016309659A1 (en) 2018-04-12
CA2995520A1 (en) 2017-02-23
CN108138237B (zh) 2022-04-05
WO2017029215A1 (en) 2017-02-23
JP7028763B2 (ja) 2022-03-02
DK3334837T3 (da) 2021-02-15
US20170046477A1 (en) 2017-02-16
CN108138237A (zh) 2018-06-08
JP2018522575A (ja) 2018-08-16

Similar Documents

Publication Publication Date Title
ES2861400T3 (es) Evaluación de la actividad de la ruta de señalización celular de NFkB usando modelos matemáticos de la expresión de genes diana
ES2833543T3 (es) Evaluación de la actividad de la ruta de señalización celular de TGF usando modelos matemáticos de la expresión de genes diana
US20220259666A1 (en) Assessment of the p13k cellular signaling pathway activity using mathematical modelling of target gene expression
ES2868887T3 (es) Evaluación de la actividad de la ruta de señalización celular de JAK-STAT1/2 usando modelos matemáticos de la expresión de genes diana
ES2838923T3 (es) Pronóstico médico y predicción de la respuesta a tratamiento usando múltiples actividades de la ruta de señalización celular
ES2857953T3 (es) Pronóstico médico y predicción de la respuesta al tratamiento usando las actividades de múltiples rutas de señalización celular
KR102256141B1 (ko) 다수의 세포 신호전달 경로 활성을 이용하는 치료 반응의 의학적 예후 및 예측
EP3729439B1 (en) Assessment of mapk-ap 1 cellular signaling pathway activity using mathematical modelling of target gene expression
WO2019068543A1 (en) EVALUATION OF THE ACTIVITY OF THE JAK-STAT3 CELL SIGNALING PATH USING THE MATHEMATICAL MODELING OF THE TARGET GENE EXPRESSION
US20230071390A1 (en) Assessment of pr cellular signaling pathway activity using mathematical modelling of target gene expression
Fotoh et al. Research Article miRNA-451a and miRNA-125a Expression Levels in Ankylosing Spondylitis: Impact on Disease Diagnosis, Prognosis, and Outcomes
Whitfield et al. Disease Classification Using Molecular Signatures