JP4594622B2 - 薬発見法 - Google Patents
薬発見法 Download PDFInfo
- Publication number
- JP4594622B2 JP4594622B2 JP2003566780A JP2003566780A JP4594622B2 JP 4594622 B2 JP4594622 B2 JP 4594622B2 JP 2003566780 A JP2003566780 A JP 2003566780A JP 2003566780 A JP2003566780 A JP 2003566780A JP 4594622 B2 JP4594622 B2 JP 4594622B2
- Authority
- JP
- Japan
- Prior art keywords
- profile
- gene
- genes
- data
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 105
- 238000007876 drug discovery Methods 0.000 title description 32
- 108090000623 proteins and genes Proteins 0.000 claims description 332
- 201000010099 disease Diseases 0.000 claims description 69
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 69
- 230000014509 gene expression Effects 0.000 claims description 45
- 102000004169 proteins and genes Human genes 0.000 claims description 41
- 230000003993 interaction Effects 0.000 claims description 28
- 238000011160 research Methods 0.000 claims description 20
- 239000000463 material Substances 0.000 claims description 16
- 238000010586 diagram Methods 0.000 claims description 15
- 230000008236 biological pathway Effects 0.000 claims description 12
- 230000004071 biological effect Effects 0.000 claims description 9
- 238000002493 microarray Methods 0.000 claims description 8
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 4
- 108020004999 messenger RNA Proteins 0.000 claims description 4
- 238000011156 evaluation Methods 0.000 claims description 3
- 230000033228 biological regulation Effects 0.000 claims description 2
- 238000012545 processing Methods 0.000 claims description 2
- 238000003672 processing method Methods 0.000 claims 1
- 230000037361 pathway Effects 0.000 description 65
- 230000008569 process Effects 0.000 description 40
- 230000000694 effects Effects 0.000 description 32
- 238000004422 calculation algorithm Methods 0.000 description 26
- 230000031018 biological processes and functions Effects 0.000 description 25
- 210000004027 cell Anatomy 0.000 description 25
- 229940079593 drug Drugs 0.000 description 25
- 239000003814 drug Substances 0.000 description 25
- 238000013459 approach Methods 0.000 description 22
- 238000002474 experimental method Methods 0.000 description 22
- 102100026557 Short-wave-sensitive opsin 1 Human genes 0.000 description 20
- 238000004458 analytical method Methods 0.000 description 18
- 230000008859 change Effects 0.000 description 16
- 230000006907 apoptotic process Effects 0.000 description 14
- 239000003596 drug target Substances 0.000 description 14
- 238000009826 distribution Methods 0.000 description 13
- 230000002159 abnormal effect Effects 0.000 description 10
- 230000027455 binding Effects 0.000 description 10
- 238000012360 testing method Methods 0.000 description 10
- 230000033077 cellular process Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 230000001105 regulatory effect Effects 0.000 description 9
- 238000013508 migration Methods 0.000 description 8
- 230000005012 migration Effects 0.000 description 8
- 238000011282 treatment Methods 0.000 description 8
- 210000003594 spinal ganglia Anatomy 0.000 description 7
- 108010042653 IgA receptor Proteins 0.000 description 6
- 102100034014 Prolyl 3-hydroxylase 3 Human genes 0.000 description 6
- 230000004913 activation Effects 0.000 description 6
- 230000009141 biological interaction Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 6
- 150000001875 compounds Chemical class 0.000 description 6
- 238000011161 development Methods 0.000 description 6
- 230000009878 intermolecular interaction Effects 0.000 description 6
- 238000011835 investigation Methods 0.000 description 6
- 210000002569 neuron Anatomy 0.000 description 6
- 238000012552 review Methods 0.000 description 6
- 101000937797 Homo sapiens Apoptosis regulator BAX Proteins 0.000 description 5
- 241000710960 Sindbis virus Species 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000010205 computational analysis Methods 0.000 description 5
- 239000012636 effector Substances 0.000 description 5
- 102000058077 human BAX Human genes 0.000 description 5
- 239000003550 marker Substances 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 210000001519 tissue Anatomy 0.000 description 5
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 4
- 108700039964 Duplicate Genes Proteins 0.000 description 4
- 206010061218 Inflammation Diseases 0.000 description 4
- 230000008827 biological function Effects 0.000 description 4
- 230000000903 blocking effect Effects 0.000 description 4
- 230000001186 cumulative effect Effects 0.000 description 4
- 230000034994 death Effects 0.000 description 4
- 230000007423 decrease Effects 0.000 description 4
- 230000004054 inflammatory process Effects 0.000 description 4
- 230000026731 phosphorylation Effects 0.000 description 4
- 238000006366 phosphorylation reaction Methods 0.000 description 4
- 230000035945 sensitivity Effects 0.000 description 4
- 101800004937 Protein C Proteins 0.000 description 3
- 108700005075 Regulator Genes Proteins 0.000 description 3
- 101800001700 Saposin-D Proteins 0.000 description 3
- 102400000827 Saposin-D Human genes 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 208000015181 infectious disease Diseases 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 108090000765 processed proteins & peptides Proteins 0.000 description 3
- 229960000856 protein c Drugs 0.000 description 3
- 230000009257 reactivity Effects 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 238000007619 statistical method Methods 0.000 description 3
- 230000001225 therapeutic effect Effects 0.000 description 3
- 238000010396 two-hybrid screening Methods 0.000 description 3
- 108700028369 Alleles Proteins 0.000 description 2
- 206010012335 Dependence Diseases 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 210000001744 T-lymphocyte Anatomy 0.000 description 2
- 230000008485 antagonism Effects 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 238000005842 biochemical reaction Methods 0.000 description 2
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 239000000470 constituent Substances 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 229940088598 enzyme Drugs 0.000 description 2
- 230000004545 gene duplication Effects 0.000 description 2
- 210000005260 human cell Anatomy 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 2
- 210000004698 lymphocyte Anatomy 0.000 description 2
- 229920002521 macromolecule Polymers 0.000 description 2
- 230000002503 metabolic effect Effects 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000000144 pharmacologic effect Effects 0.000 description 2
- 102000054765 polymorphisms of proteins Human genes 0.000 description 2
- 229920001184 polypeptide Polymers 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 102000004196 processed proteins & peptides Human genes 0.000 description 2
- 238000011321 prophylaxis Methods 0.000 description 2
- 230000004850 protein–protein interaction Effects 0.000 description 2
- 238000003908 quality control method Methods 0.000 description 2
- 108020003175 receptors Proteins 0.000 description 2
- 102000005962 receptors Human genes 0.000 description 2
- 238000001963 scanning near-field photolithography Methods 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 238000002560 therapeutic procedure Methods 0.000 description 2
- 230000009261 transgenic effect Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 230000003827 upregulation Effects 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 101150000874 11 gene Proteins 0.000 description 1
- 208000007848 Alcoholism Diseases 0.000 description 1
- 208000019901 Anxiety disease Diseases 0.000 description 1
- 241000239290 Araneae Species 0.000 description 1
- 210000002237 B-cell of pancreatic islet Anatomy 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 102100035875 C-C chemokine receptor type 5 Human genes 0.000 description 1
- 101710149870 C-C chemokine receptor type 5 Proteins 0.000 description 1
- 206010007559 Cardiac failure congestive Diseases 0.000 description 1
- 108020004414 DNA Proteins 0.000 description 1
- 101150071111 FADD gene Proteins 0.000 description 1
- 102000003688 G-Protein-Coupled Receptors Human genes 0.000 description 1
- 108090000045 G-Protein-Coupled Receptors Proteins 0.000 description 1
- 208000002705 Glucose Intolerance Diseases 0.000 description 1
- 206010018429 Glucose tolerance impaired Diseases 0.000 description 1
- 206010019280 Heart failures Diseases 0.000 description 1
- 208000035150 Hypercholesterolemia Diseases 0.000 description 1
- 206010020772 Hypertension Diseases 0.000 description 1
- 102000004877 Insulin Human genes 0.000 description 1
- 108090001061 Insulin Proteins 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- 238000000342 Monte Carlo simulation Methods 0.000 description 1
- 101100109294 Mus musculus Arhgef28 gene Proteins 0.000 description 1
- 108010038807 Oligopeptides Proteins 0.000 description 1
- 102000015636 Oligopeptides Human genes 0.000 description 1
- 108700005081 Overlapping Genes Proteins 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 230000001594 aberrant effect Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000009798 acute exacerbation Effects 0.000 description 1
- 238000009098 adjuvant therapy Methods 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000008484 agonism Effects 0.000 description 1
- 201000007930 alcohol dependence Diseases 0.000 description 1
- 210000003484 anatomy Anatomy 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- 230000036506 anxiety Effects 0.000 description 1
- 101150058790 bcp gene Proteins 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000008238 biochemical pathway Effects 0.000 description 1
- 239000012620 biological material Substances 0.000 description 1
- 210000000601 blood cell Anatomy 0.000 description 1
- 210000004958 brain cell Anatomy 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006854 communication Effects 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 210000000172 cytosol Anatomy 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 230000035622 drinking Effects 0.000 description 1
- 238000002651 drug therapy Methods 0.000 description 1
- 230000008482 dysregulation Effects 0.000 description 1
- UGDGKPDPIXAUJL-UHFFFAOYSA-N ethyl n-[4-[benzyl(2-phenylethyl)amino]-2-(4-ethylphenyl)-1h-imidazo[4,5-c]pyridin-6-yl]carbamate Chemical compound N=1C(NC(=O)OCC)=CC=2NC(C=3C=CC(CC)=CC=3)=NC=2C=1N(CC=1C=CC=CC=1)CCC1=CC=CC=C1 UGDGKPDPIXAUJL-UHFFFAOYSA-N 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000013401 experimental design Methods 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 229940125396 insulin Drugs 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 210000005265 lung cell Anatomy 0.000 description 1
- 101150112095 map gene Proteins 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000010534 mechanism of action Effects 0.000 description 1
- 238000009448 modified atmosphere packaging Methods 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 230000004001 molecular interaction Effects 0.000 description 1
- 235000019837 monoammonium phosphate Nutrition 0.000 description 1
- 150000007523 nucleic acids Chemical group 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 230000002974 pharmacogenomic effect Effects 0.000 description 1
- 230000001766 physiological effect Effects 0.000 description 1
- 239000002574 poison Substances 0.000 description 1
- 231100000614 poison Toxicity 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 1
- 238000011045 prefiltration Methods 0.000 description 1
- 230000000069 prophylactic effect Effects 0.000 description 1
- 230000003014 reinforcing effect Effects 0.000 description 1
- 230000004043 responsiveness Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000001629 sign test Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 210000004927 skin cell Anatomy 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 230000000391 smoking effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 238000012916 structural analysis Methods 0.000 description 1
- 230000004960 subcellular localization Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 231100000027 toxicology Toxicity 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
- G16B25/10—Gene or protein expression profiling; Expression-ratio estimation or normalisation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
- G16B5/20—Probabilistic models
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
- G16B50/10—Ontologies; Annotations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B45/00—ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
Landscapes
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Genetics & Genomics (AREA)
- Physiology (AREA)
- Bioethics (AREA)
- Databases & Information Systems (AREA)
- Analytical Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Probability & Statistics with Applications (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Epidemiology (AREA)
- Evolutionary Computation (AREA)
- Public Health (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Description
● 遺伝子Aの上昇調節(制御;regulation)は、蛋白質Aの発現をもたらす。
● 蛋白質Aは、蛋白質B、或る細胞型を燐酸化する。
● 蛋白質Bは、燐酸化されることにより遺伝子Cを上昇調節する。
● 蛋白質Cの上昇調節は、蛋白質Cの発現をもたらす。
● 蛋白質CはT細胞を活性化する。
● T細胞の活性化は炎症を起こす。
本発明は、特定の表現型形質のための経路を同定する方法に関する。特別な代表的態様として、本発明は、直接コンピューター分析により病気の経路を定めるのみならず、異なった遺伝子、遺伝子産物、又はプロセスの間の複雑な関係を定めることにより、薬発見の標的を同定する方法に関する。別の態様として、本発明は、既知の薬のための新しい用途を同定する方法を与え、与えられた薬で処置した時に起こり易い副作用を予測する方法、及び与えられた個々の人に対する与えられた薬の効果を予測する方法を与える。
定義
本明細書で用いられている用語は次の通りである:
「病気」とは、例として病気又は病気状態、病気への素質又は感受性、又は異常な薬物反応を含めた重要な表現型又は表現型形質を意味する。病気状態の例示としての例には、高いコレステロール・レベル、鬱血性心不全、高血圧、糖尿病、グルコース不耐性、鬱病、不安、感染症、中毒状態、薬物治療副作用、薬物治療無効症、アルコール症、依存症等が含まれるが、それらに限定されるものではない。
好ましい態様として、情報は記憶され、二つのデーターベースを用いてアクセスされる。第一データーベースは、エフェクター遺伝子(及び/又は産物)−>目的遺伝子(及び/又は産物)型関係の形態を一般にとる予め定められた因果関係に従って構造化された科学的調査事項の知識ベース(KB)である(今後「調査事項KB」として言及する)。この調査事項KBについての好ましいデーターベース構造は、フレーム型知識表示データー・モデルであるが、別法として、他のデーターベース構造を、科学的調査事項を構造化するために用いてもよい。第二データーベースの型は、オントロジーである。オントロジーは、好ましくはフレーム型フォーマットで組織化された分類法及び形式コンセプト及び興味のある領域に関する関係の多重階層表示(multiple-hierarchical representation)である。調査事項KB及びオントロジーは、ここでは集約的に知識表示システム(knowledge representation system)(KRS)として言及する。KRSを含む一つ以上の知識ベースを含む他のデーターベース構造を、本発明を実施する場合の一群の知識を表すために用いてもよい。しかし、オントロジーを他のKBと一緒に用いてKRSを形成するか又は単独にKRSとして用いた場合、本発明の方法は、科学的調査事項についての結論を推測する目的でオントロジーで定められた分類及び形式コンセプト及び関係を強化することができるのであり、本発明の方法によらなければ、それらの科学的調査事項は、特にそれら調査事項が複雑な、又は多方向的系列の原因事項の一部分を形成する場合には、容易には明らかにならないであろう。従って、本発明を実施するのに用いることができる好ましいオントロジーについての一層の説明を下に与える。
次に、本発明の原理に従い、ユーザーが供与した特異的遺伝子発現データーに関連して、薬発見経路の候補を分析、理解、又はその正当性の確認を行うのに、如何にKRSを用いることができるかの例を与える。前の記載と同様に、本発明の好ましい例としての態様についてのこの詳細な記述は、例示の目的のためとしてのみ考えられており、本発明を限定するものではない。むしろ、本発明の限定は、添付の特許請求の範囲に記載されている。
「プロファイル」は、生物学的に同等なやり方で作用すると思われる遺伝子又は遺伝子産物の特定の組合せのようなコンセプトについての情報を含んでいてもよく、それらに従って定義することができ、例えば、病気関連経路、細胞及び/又は細胞成分、解剖部分、分子、細胞又は病気のプロセス、及びそれらの間の関係の全て又は一部分を形成していてもよい。好ましいプロファイル生成及びプロファイル対データースコアリングアルゴリズムについての概説は下に与える。しかし、この例に入る前に、この議論で用いられる「プロファイル」が、研究者の目的に適した基準(単数又は複数)に従って定義されるデーターベース中に含まれたデーターの部分集合に関係していることを強調することは重要である。そのようなものとして基準(単数又は複数)は、研究者の要求により少なくとも部分的に決定されるプロファイルのどのようなアトリビュート(attribute)でも意味している。このことは、一つ以上の生物学的コンセプト、プロファイルのサイズ(size)(例えば、グラフサイズ)、又はプロファイル中の調査事項連結性に関連して定められた基準を含んでいてもよい。従って、下に列挙したプロファイル基準の例は、プロファイル決定条件の態様の例に過ぎないことを意図していることを覚えておくべきである。一般に、プロファイルを定める基準は、本発明によるプロファイル構造が研究目的によって駆動されるので、本発明の適用毎に変化するであろうことは理解され、実際に予想されることである。
再び図3に関し、工程1、プロファイル生成は、KBからのプロファイルの一つ以上のライブラリーをアセンブルする計算を予め行うことから始まる。各ライブラリーは、或る組みの基準に適合したKB中に見出される全てのプロファイルを含む。その基準は、システムにより予め設定されていてもよく、又はユーザーにより規定してもよく、データーベース中のどの範疇にでも、例えば遺伝子又は遺伝子産物、プロセス、調査事項の資料、有機体の型等、又は他の基準、例えば、一つのプロファイルについてのノード(node)の限界数に所属させてもよい。
● 薬標的情報を有するプロファイルの、既知の薬標的である遺伝子を目で見えるように強調することにより(即ち、そのためには標的となる分子が見出され、或は作られている)、又はそのために、例えば、遺伝子系列構成員に基づいて良好な薬標的であるかも知れないことを示唆する証拠が存在することによる注釈付け。薬標的情報は、プロファイル図解上でその遺伝子を単に強調することによりそれら結果の中に統合することができ、或は薬標的情報は、プロファイルをスコアリングする時に考慮することができるであろう。
上で述べたように、分析の第一工程は、生物学的経路についてコンピューターモデルを生成する。「プロファイル」として言及するこれらのモデルは、マイクロアレイ発現データーのようなゲノムデーター組を問い合わせ、解釈するためのツールになる。それらはKB中の調査事項から構成され、それらの既知の巨大分子相互作用、及びそれら遺伝子が関与することをKBが明示した種々の生物学的プロセスと一緒にした遺伝子(産物)抄録の組からなる。
■ ノード及び/又はエッジを選択する時に適用される基準は、生成するプロファイルの組成及び構造に多様性を与えることができる。
■ プロファイル構成前であるが、表現データーに対するスコアリングを行う前に適用される基準は、無駄な誤った「ヒット(hit)」を減少し、或は一層焦点のあった分析を与えることができる。
■ プロファイル構成後で、表現スコアリング後に適用される基準は、研究者による再検討のため、プロファイルの付加的ランク付けを与えることができる(表現スコアリング以外の基準により)。
「種子」ノード及び種子を他のノードに連結するエッジを越えて、無数のやり方でプロファイルを構成することができる。これらのアプローチは、全て次の目的を取扱うことを試みている:KRSにより表された巨大分子相互作用の完全なセット(set)は、通常余りにも大きく、余りにも多様なので全体的にゲノミクスデーター・セットと比較することはできないであろう。従って、アルゴリズムはこの大きな「巨大分子相互作用領域」を、ゲノムデーター・セットの一層きめの細かい検証を支持するため、多数の実際的大きさの相互作用近隣へ「切り分ける(carve up)」ことが必要である。この切り分けは、異なったプロファイル間のかなりの遺伝子重複をもって行われ、遺伝子の希な組合せが見落とされるかもしれない機会を最小限にすべきである。一方、プロファイルの大きさ中程度にし、プロファイルに帰属するであろう生物学的機能のセットが、余りにも多様又は不均質にならないようにすべきである。大きさの小さいプロファイルは、人間の再検討及び解釈にも役立つ、他方、プロファイルはゲノムデーター・セット及び/又は生物学的関連、例えば、KB中に定義された(下で論ずるように)分子、細胞、有機体、及び/又は病気プロセスとの関連を計算する場合に充分な統計的力が存在するように、充分大きくすべきである(即ち、それらは、例えば、充分な数の遺伝子を含むべきである)。別の問題は、プロファイルが、中心「種子」遺伝子に結合された遺伝子の収集で比較的対称的になるべきことである。換言すれば、高度に相互関連した「第一段」遺伝子(即ち、種子に直接結合した遺伝子)は、第二段遺伝子(即ち、種子から1ステップ除かれた遺伝子)を有するプロファイルをスワンプ(swamp)させるべきではない。なぜなら、これは、プロファイルの種子遺伝子中心性を変化させることがあるからである。
遺伝子組成、結合性、及び経路プロファイルの動的性質、及びそれらが発現データー・パターンとどのように重複しているかを理解し易くするため、本発明によるシステムを生物学的関連を有するプロファイルを自動的に注釈し、それらプロファイルを相互作用図解にするように構成することができる。
■ 別の巨大分子に作用する巨大分子を含む分子プロセス
■ 細胞の状態の変化を含む細胞プロセス
■ 有機体又は有機体構成物の状態の変化を含む有機体プロセス
■ 有機体又は有機体構成物の状態の異常な変化を含む病気プロセス。
目的は、統計的に意味のあるやり方でプロファイル中に遺伝子を収集することに伴われるKBからの生物学的現象を現すことである。プロファイル中の20又は40の遺伝子は、夫々多くの生物学的プロセスに関与していると思われるが、最も重要なものは、多くの遺伝子により共有されているものである。統計的に意味のあるものであるためには、共有された生物学的関連が、機会単独で予測されるよりも大きな頻度で起きるべきである。これらの重要な関連を我々は見出したいばかりではなく、その関連の重要性の尺度も見出したい。この統計的重要性の尺度は、「P−値)と呼ばれている。それは確率測定(0〜1の範囲の値を有する)であり、それは観察された生物学的関連が単に機会によるものである見込みを示している。特に0.05より低い(即ち、95%より高い信頼性)場合、P−値が低い程、それら関連を単なる機会事項としては説明しにくくなる。
KBから生成したプロファイルに基づく統計的分析をスコアリングする表現の一例を次に与える。次の一般化された仮定は、この統計的分析に関連して行われた:
1. 知識ベースは、0以上の(KB)明確な遺伝子の各々について一つ以上の調査事項を含んでいる。
2. 生成したプロファイルの各々は、KBからの遺伝子のセットである〔BCP=生物学的に同等の(Biologically Coovdinated Pathway)経路〕。
3. ユーザーは、1セットの遺伝子(USRの明確な遺伝子)を分析する。
4. ユーザーが遺伝子のその地図(MAP)を分析した遺伝子は、[0,KB]の範囲にある。
5. ユーザーが分析する遺伝子は、異常制御(DYS)されていてもよく、[0,USR]の範囲にある。
6. 重要な遺伝子は、異常制御され、遺伝子に図示された遺伝子(SIG)であり、それは[0,MAP]の範囲に入る。
7. SIG遺伝子の幾つかは、特定のファイル中の遺伝子であってもよい。特定のBCPの場合、この重複(OVP)は、[0,最小(BCP,SIG)]の範囲にある。
最初のアプローチは、固定されたKB、MAP、BCP、及びSIGを与えて大きさOVPを観察する正確な確率を計算することである。それは、もしプロファイルを生成したアルゴリズムがKB全遺伝子のセットからBCP遺伝子のセットを無作為的に取り上げた場合(即ち、我々が、遺伝子がどのように互いに関連しているかについて得た全ての情報を無視し、どのようなBCP全遺伝子の組合せでも無差別に取り上げた場合)及び検定中の異常制御遺伝子も無作為的である場合(即ち、どの分析された遺伝子でも、異常制御されている同じ確率を有する場合)、どのようなことが予想されるかを計算する。この統計の目的は、もし整合したプロファイルと分析結果との両方が全て完全に無作為的であった場合に重複を観察することがどのように起こり得るかを示すことである。従って、計算された値が1(100%)に近い程、偶然に重複が一層起き易く、値が0に近い程、一層よい。なぜなら、どのように重複が起きるかの説明として(帰無仮説)「無作為的機会」は一層起こりにくくなるからである。
P(OVP)=[SIG!*BCP!*(KB−OVP)!*(MAP−OVP)!]/[(SIG−OVP)!*(BCP−OVP)!*KB!*MAP!]
1. 一定数のKB遺伝子及び一定数のSIG遺伝子について:
a.プロファイルが大きい程(>BCP)、偶然生ずる一致の確率は高くなる。
b.重複が大きくなる程(>OVP)、偶然に起きる一致の確率は低くなる。
2. 一定数のOVP遺伝子及び一定数のBCP遺伝子について:
a.異常制御図示遺伝子が多くなる程(>SIG)、偶然に起きる一致の確率は高くなる。
b.我々が知っている遺伝子が多くなる程(>KB)、偶然に起きる一致の確率は低くなる。
3. もしBCP=KBであり、もしOVPが0でないならば、P(OVP)=1(即ち、100%)。
4. もしSIG=KBで、もしOVPが0でないならば、P(OVP)=1。なぜなら、このことは、KB中のどの遺伝子でも異常制御されたユーザー遺伝子であり、従って、可能なプロファイルのいずれについてもOVP=BCPであることを意味するからである。
5. もしMAP<KBであるならば、P(OVP)は、一般にMAP=KBの場合よりも大きい(即ち、一層ランダムになり易い)。
1. KB≫BCP(即ち、プロファイルが、KB中の全ての遺伝子の小さな部分集合しか含まない)。
2. OVP≫1(即ち、プロファイルに重複する異常制御ユーザー遺伝子が多くなる程、偶然に起きる確率は低くなる)。
3. MAP=KB(即ち、全てのユーザー遺伝子がKB中の遺伝子に図示されている)。
4. BCP=OVP(即ち、プロファイル中のどの遺伝子も異常制御された遺伝子である)。
5. SIG=OVP(即ち、全ての図示された異常制御遺伝子がプロファイルに重複している)。
実験に亙る重複を比較するのみならず、重複の重要性についての一層よい直感的感触を得るための好ましい統計は、確率分布関数(即ち、アプローチ1のもの)からの単一値の代わりに、累積確率分布を用いることである。これは、正確な確率値に等しいかそれより低い個々の確率値の全てを合計し、全ての可能な確率値の全合計のどの位の分率がそれを表すかを決定することにより計算することができる。この測定は、通常「P−値」と呼ばれている。
2. 実験に亙ってP−値を比較する場合、図示された遺伝子(MAP)の数を一定とする。これは、ユーザーが夫々の実験について同じ遺伝子の全てを検定することを要求するよりも厳密性は低いが、恐らくそれは標準であろう。ユーザーは夫々の検定で、同じ図示された遺伝子を検定しさえすればよい。しかし、もし彼らが一般的検定結果を、一般に図示遺伝子の僅かな分画について標的又は異なった検定と比較するならば、P−値の結果は直接比較できないであろう。
3. 図示された異常制御遺伝子(SIG)の数は、実験を通して変化させてもよい(即ち、0≦SIG≦MAP)。しかし、与えられたどの実験についても、SIG遺伝子の全数はランダムではないと仮定するが、特定のSIG遺伝子はランダムであると仮定する。
プロファイルで表された経路の信用性及びそのユーザー供与ゲノミクス・データーに対する関連は、(1)生物学的経路の特性を正確に表すKBの能力、及び(2)KB中の与えられたどの経路でも、ユーザー供与データーの根底を成す真の生物学的経路を表す程度、に依存している。これらの計量は、経路品質アトリビュート(PQA)と呼ばれている。前に論じたプロファイルスコアリングの例は、カテゴリー2型PQAに入り、プロファイル・モデル中に含まれる特定の経路についてのKBの知識度は、カテゴリー1型PQAに相当するであろう。
本発明の方法を実施するためのシステムは、例えば、生物学的経路情報のためのKBを作成し、それを質問し、研究結果についてのユーザー・インターフェースを与える単一の実在物、例えば個人的会社に限定する必要はない。むしろシステムは、一緒した時に(例えば、顧客により、又はシステム完成者により)本発明の方法を実施するのに用いることができるシステムを与える一つ以上の実体から併合努力の結果として生成させることができる。このシステムの構成部分を開発することに伴われる仕事の各々を如何にして与えるかの例を次に記載する。「会社A」「会社B」等を参考にする。これらの実体は、公共的実体、個人的実体、公共・個人的実体、又はそれらの組合せに相当するであろう。
3 知識ベース
4 KB調査事項
5 グラフ
6 グラフ
7 プロファイル・ライブラリー
9 プロファイル
10 表現データー
11 遺伝子
12 スコアリング
14 プロファイル・リスト
17 図解
22 他の調査事項
Claims (21)
- (a)オントロジーを記憶する第1データベース及びそのオントロジーに応じて構築されたゲノミクス情報を記憶する第2データベースを含む知識表示システム(knowledge representation system)(KRS)を含むデータベースであって、ここで、
該ゲノミクス情報が科学的調査事項であり、
該オントロジーが、
(i) 遺伝子、遺伝子産物、及び生物学的効果を含み;
(ii) 該遺伝子、遺伝子産物、及び生物学的効果がクラスによって分類され、そして
(iii) 各遺伝子又は遺伝子産物、及び任意の病気状態の関係がスロット及びファセットにより定義されるように組織される、上記データベースと、
(b)その構築したゲノミクス情報から生物学的な経路プロファイルのライブラリーを生成する生成手段であって、ここで、
プロフィール生成基準がシステム又はユーザーから受け取られ、該プロフィール生成基準に合った保存された構築したゲノミクス情報の部分集合が第2データベースから抽出されるものである、上記生成手段と、
(c)ユーザーより別のゲノミクス情報を提供される入力手段と、
並びに、
(d)該ユーザーにより提供された別のゲノミクス情報を該生物学的な経路プロファイルのライブラリーと比較することによってプロファイルをスコアリングする評価手段であって、ここで、
該プロファイルのスコアリングが、ユーザーによって供与されたデーターに対してプロファイルをランク付けする統計値を計算することを含む、上記評価手段とを含む、
コンピューターシステムを機能させるための、コンピューター処理方法。 - ステップ(d)に続くステップ(e)として、
(e)スコアリング結果をユーザーに表示することを含む、
請求項1に記載の方法。 - 生物学的な経路プロファイルのライブラリーが予め生成されている、請求項1に記載の方法。
- ユーザーにより提供されたゲノミクス情報が、複数の公共的資料から抽出されたデーターを含む、請求項1に記載の方法。
- ユーザーにより提供されたゲノミクス情報が、所有権を有するデーターを含む、請求項1に記載の方法。
- ユーザーにより提供されたゲノミクス情報が、所有権を有するデーター資料及び公共的データー資料の組合せから抽出されたデーターを含む、請求項1に記載の方法。
- ユーザーにより供与されたゲノミクス情報が遺伝子発現データーである、請求項1に記載の方法。
- 遺伝子発現データーがマイクロアレイからのものである、請求項7に記載の方法。
- 遺伝子発現データーが異常制御された遺伝子のリストに変換され、ここでその異常制御された遺伝子は制御(調節;レギュレーション)又は発現においてコントロールに比べて少なくとも2倍の差を示すものである、請求項7に記載の方法。
- ゲノミクス情報が、遺伝子、遺伝子のDNA配列、mRNA、遺伝子産物、及び発現した蛋白質の生物学的効果に関するデーターを含む、請求項1に記載の方法。
- 生物学的な経路プロファイルが
(i)システム又はユーザーからプロファイル生成基準を受け取り、
(ii)第2データベースからプロファイル生成基準に適合した、構築したゲノミクス情報の部分集合を抽出し、
(iii)その構築したゲノミクス情報の部分集合をグラフィカルデーター構造に変換し、及び、
(iv)グラフィカルデーター構造を生物学的な経路プロファイルを作成するために処理することを含む手順によって生成される、
請求項1又は2に記載の方法。 - グラフィカルデーター構造が全て既知の相互作用のマスターグラフである、請求項11の方法。
- グラフィカルデーター構造が、各々の遺伝子に関連した相互作用を表すエッジにより連結されたノードとしての各々の遺伝子を表記するものである、請求項11に記載の方法。
- 第2データベースにおける各々の遺伝子に対して1つのプロファイルが作成される、請求項11に記載の方法。
- プロファイルのスコアリングが、ユーザーによって供与されたデーターに対してプロファイルをランク付けするP−値を計算することを更に含む、請求項1に記載の方法。
- スコアリング結果が、プロファイルスコアに応じてランク付けされたプロファイルのリストとして表示されるものである、請求項2に記載の方法。
- 各々のプロファイルが、プロファイルが基礎とする遺伝子及びユーザーから提供されたゲノミクス情報であってプロファイルにも現れているものである任意の遺伝子をリストにする、請求項1又は2に記載の方法。
- スコアリング結果がスプレッドシートプログラムを用いて提示されるものである、請求項2に記載の方法。
- スコアリング結果が各々のプロファイルのプロファイル図解(diagram)として表示されるものであり、そのプロファイルからの全ての遺伝子及びそれらの間の重要関係を示しているものである、請求項2に記載の方法。
- スコアリング結果が与えられたプロファイルにより明らかにされた生物学の記述又は要約として表示された、請求項2に記載の方法。
- スコアリング結果がユーザーにグラフィカル・ユーザー・インタフェース(GUI)相互作用形式で提示される、請求項2に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US35317602P | 2002-02-04 | 2002-02-04 | |
US42177202P | 2002-10-29 | 2002-10-29 | |
PCT/US2003/003006 WO2003067504A2 (en) | 2002-02-04 | 2003-02-03 | Drug discovery methods |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2006501531A JP2006501531A (ja) | 2006-01-12 |
JP2006501531A5 JP2006501531A5 (ja) | 2009-09-17 |
JP4594622B2 true JP4594622B2 (ja) | 2010-12-08 |
Family
ID=27737434
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003566780A Expired - Fee Related JP4594622B2 (ja) | 2002-02-04 | 2003-02-03 | 薬発見法 |
Country Status (6)
Country | Link |
---|---|
US (2) | US8489334B2 (ja) |
EP (2) | EP1490822A2 (ja) |
JP (1) | JP4594622B2 (ja) |
AU (2) | AU2003207786B2 (ja) |
CA (1) | CA2474754C (ja) |
WO (1) | WO2003067504A2 (ja) |
Families Citing this family (45)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7577683B2 (en) | 2000-06-08 | 2009-08-18 | Ingenuity Systems, Inc. | Methods for the construction and maintenance of a knowledge representation system |
US6741986B2 (en) * | 2000-12-08 | 2004-05-25 | Ingenuity Systems, Inc. | Method and system for performing information extraction and quality control for a knowledgebase |
EP1490822A2 (en) | 2002-02-04 | 2004-12-29 | Ingenuity Systems Inc. | Drug discovery methods |
US8793073B2 (en) * | 2002-02-04 | 2014-07-29 | Ingenuity Systems, Inc. | Drug discovery methods |
US7865534B2 (en) | 2002-09-30 | 2011-01-04 | Genstruct, Inc. | System, method and apparatus for assembling and mining life science data |
CA2546869A1 (en) * | 2003-11-26 | 2005-06-16 | Genstruct, Inc. | System, method and apparatus for causal implication analysis in biological networks |
JPWO2005096207A1 (ja) * | 2004-03-30 | 2008-02-21 | 茂男 井原 | 文献情報処理システム |
US20060053172A1 (en) * | 2004-09-03 | 2006-03-09 | Biowisdom Limited | System and method for creating, editing, and using multi-relational ontologies |
US7644077B2 (en) * | 2004-10-21 | 2010-01-05 | Microsoft Corporation | Methods, computer readable mediums and systems for linking related data from at least two data sources based upon a scoring algorithm |
DK1836665T3 (da) * | 2004-11-19 | 2013-04-15 | Glaxosmithkline Llc | Fremgangsmåde til specialtilpasset afgivelse af medikamentkombinationsprodukter med variabel dosis til individualisering af terapier |
FI20055198A (fi) * | 2005-04-28 | 2006-10-29 | Valtion Teknillinen | Visualisointitekniikka biologista informaatiota varten |
EP1938231A1 (en) * | 2005-09-19 | 2008-07-02 | BG Medicine, Inc. | Correlation analysis of biological systems |
US20080033819A1 (en) * | 2006-07-28 | 2008-02-07 | Ingenuity Systems, Inc. | Genomics based targeted advertising |
US20100210025A1 (en) * | 2006-08-15 | 2010-08-19 | Victor Chang Cardiac Research Institute Limited | Common Module Profiling of Genes |
US20100112728A1 (en) * | 2007-03-31 | 2010-05-06 | Advanced Technology Materials, Inc. | Methods for stripping material for wafer reclamation |
CA2698084A1 (en) | 2007-08-29 | 2009-03-05 | Genstruct, Inc. | Computer-aided discovery of biomarker profiles in complex biological systems |
US9831088B2 (en) | 2010-10-06 | 2017-11-28 | Entegris, Inc. | Composition and process for selectively etching metal nitrides |
EP2740026A4 (en) | 2011-08-03 | 2015-06-24 | Ingenuity Systems Inc | METHOD AND SYSTEMS FOR BIOLOGICAL DATA ANALYSIS |
KR101143466B1 (ko) * | 2011-09-26 | 2012-05-10 | 한국과학기술정보연구원 | 연구 연관도 서비스 제공 방법 및 시스템 |
US9773091B2 (en) | 2011-10-31 | 2017-09-26 | The Scripps Research Institute | Systems and methods for genomic annotation and distributed variant interpretation |
WO2013070634A1 (en) | 2011-11-07 | 2013-05-16 | Ingenuity Systems, Inc. | Methods and systems for identification of causal genomic variants |
US9600625B2 (en) | 2012-04-23 | 2017-03-21 | Bina Technologies, Inc. | Systems and methods for processing nucleic acid sequence data |
US11342048B2 (en) | 2013-03-15 | 2022-05-24 | The Scripps Research Institute | Systems and methods for genomic annotation and distributed variant interpretation |
US9418203B2 (en) | 2013-03-15 | 2016-08-16 | Cypher Genomics, Inc. | Systems and methods for genomic variant annotation |
CA2942811A1 (en) | 2013-03-15 | 2014-09-25 | The Scripps Research Institute | Systems and methods for genomic annotation and distributed variant interpretation |
CN105095623B (zh) * | 2014-05-13 | 2017-11-17 | 中国人民解放军总医院 | 疾病生物标志物的筛选分析方法、平台、服务器及系统 |
JP6550571B2 (ja) * | 2014-11-18 | 2019-07-31 | 国立研究開発法人産業技術総合研究所 | 薬剤探索装置、薬剤探索方法およびプログラム |
US10546019B2 (en) | 2015-03-23 | 2020-01-28 | International Business Machines Corporation | Simplified visualization and relevancy assessment of biological pathways |
US10395759B2 (en) | 2015-05-18 | 2019-08-27 | Regeneron Pharmaceuticals, Inc. | Methods and systems for copy number variant detection |
US11515004B2 (en) | 2015-05-22 | 2022-11-29 | Csts Health Care Inc. | Thermodynamic measures on protein-protein interaction networks for cancer therapy |
WO2016191626A1 (en) | 2015-05-26 | 2016-12-01 | Ayasdi, Inc. | Outcome analysis for graph generation |
AU2016326742B2 (en) * | 2015-09-24 | 2022-04-28 | Caris Science, Inc. | Method, apparatus, and computer program product for analyzing biological data |
US10930372B2 (en) * | 2015-10-02 | 2021-02-23 | Northrop Grumman Systems Corporation | Solution for drug discovery |
JP6765433B2 (ja) | 2016-02-12 | 2020-10-07 | リジェネロン・ファーマシューティカルズ・インコーポレイテッドRegeneron Pharmaceuticals, Inc. | 異常な核型の検出のための方法 |
US10773088B2 (en) | 2017-04-11 | 2020-09-15 | Medtronic, Inc. | Low power wireless communication |
US11721441B2 (en) * | 2019-01-15 | 2023-08-08 | Merative Us L.P. | Determining drug effectiveness ranking for a patient using machine learning |
WO2021035453A1 (en) * | 2019-08-23 | 2021-03-04 | Foshan Hl Science & Technology Limited | Intelligent green-manufacturing system for making recipe-products with coal-based nano-carbon polymorphs |
WO2021111113A1 (en) * | 2019-12-03 | 2021-06-10 | Benevolentai Technology Limited | Prioritising biological targets |
CN111782818A (zh) * | 2020-06-05 | 2020-10-16 | 牛张明 | 生物医疗知识图谱的构建装置、方法、系统及存储器 |
CN111986818A (zh) * | 2020-08-21 | 2020-11-24 | 南通大学 | 一种基于tmprss2的新冠covid-19治疗药物筛选系统 |
US12131808B2 (en) * | 2020-12-10 | 2024-10-29 | Hewlett Packard Enterprise Development Lp | Massively parallel processing database for sequence and graph data structures applied to rapid-response drug repurposing |
US11481235B2 (en) | 2021-01-11 | 2022-10-25 | Evicore Healthcare MSI, LLC | Database framework model transformation for pathway identification |
CN112396185B (zh) * | 2021-01-21 | 2021-05-11 | 中国人民解放军国防科技大学 | 一种事实验证方法、系统、计算机设备和存储介质 |
CN113488119B (zh) * | 2021-06-18 | 2024-02-02 | 重庆医科大学 | 药物小分子数值特征结构化数据库及其建立方法 |
CN114255885B (zh) * | 2021-12-14 | 2024-09-13 | 浙江创邻科技有限公司 | 一种基于图数据的新药研发管理系统及方法 |
Family Cites Families (63)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IL36404A (en) | 1970-03-18 | 1976-03-31 | Hokko Chem Ind Co | N-(substituted methyl)-n'-phenylformamidine derivatives and compositions containing them |
US5317507A (en) * | 1990-11-07 | 1994-05-31 | Gallant Stephen I | Method for document retrieval and for word sense disambiguation using neural networks |
US5398183A (en) * | 1990-12-10 | 1995-03-14 | Biomedical Systems Corporation | Holter ECG report generating system |
US5371807A (en) * | 1992-03-20 | 1994-12-06 | Digital Equipment Corporation | Method and apparatus for text classification |
US5418971A (en) * | 1992-04-20 | 1995-05-23 | International Business Machines Corporation | System and method for ordering commands in an automatic volume placement library |
US5377103A (en) * | 1992-05-15 | 1994-12-27 | International Business Machines Corporation | Constrained natural language interface for a computer that employs a browse function |
US5434777A (en) * | 1992-05-27 | 1995-07-18 | Apple Computer, Inc. | Method and apparatus for processing natural language |
EP0592238B1 (en) * | 1992-10-09 | 2002-01-16 | Matsushita Electric Industrial Co., Ltd. | Certifiable optical character recognition |
US5794050A (en) * | 1995-01-04 | 1998-08-11 | Intelligent Text Processing, Inc. | Natural language understanding system |
US6061675A (en) * | 1995-05-31 | 2000-05-09 | Oracle Corporation | Methods and apparatus for classifying terminology utilizing a knowledge catalog |
US5963966A (en) * | 1995-11-08 | 1999-10-05 | Cybernet Systems Corporation | Automated capture of technical documents for electronic review and distribution |
JP3612125B2 (ja) * | 1995-12-14 | 2005-01-19 | 株式会社東芝 | 情報フィルタリング方法および情報フィルタリング装置 |
US6076088A (en) * | 1996-02-09 | 2000-06-13 | Paik; Woojin | Information extraction system and method using concept relation concept (CRC) triples |
JPH1049549A (ja) * | 1996-05-29 | 1998-02-20 | Matsushita Electric Ind Co Ltd | 文書検索装置 |
US6101488A (en) * | 1996-09-04 | 2000-08-08 | Fujitsu Limited | Intelligent information program generation and retrieval system |
US6023659A (en) * | 1996-10-10 | 2000-02-08 | Incyte Pharmaceuticals, Inc. | Database system employing protein function hierarchies for viewing biomolecular sequence data |
JPH10207939A (ja) * | 1997-01-17 | 1998-08-07 | Nec Corp | ワークフローシステム |
US6038560A (en) * | 1997-05-21 | 2000-03-14 | Oracle Corporation | Concept knowledge base search and retrieval system |
CA2239146C (en) * | 1997-05-30 | 2007-08-07 | Alan D. Ableson | Method and apparatus for determining internal n-dimensional topology of a system within a space |
DE69823206T2 (de) * | 1997-07-25 | 2004-08-19 | Affymetrix, Inc. (a Delaware Corp.), Santa Clara | Verfahren zur herstellung einer bio-informatik-datenbank |
US6554705B1 (en) * | 1997-08-22 | 2003-04-29 | Blake Cumbers | Passive biometric customer identification and tracking system |
US5976842A (en) * | 1997-10-30 | 1999-11-02 | Clontech Laboratories, Inc. | Methods and compositions for use in high fidelity polymerase chain reaction |
US6226377B1 (en) * | 1998-03-06 | 2001-05-01 | Avaya Technology Corp. | Prioritized transaction server allocation |
JP3597370B2 (ja) | 1998-03-10 | 2004-12-08 | 富士通株式会社 | 文書処理装置および記録媒体 |
US6236987B1 (en) * | 1998-04-03 | 2001-05-22 | Damon Horowitz | Dynamic content organization in information retrieval systems |
US6424980B1 (en) * | 1998-06-10 | 2002-07-23 | Nippon Telegraph And Telephone Corporation | Integrated retrieval scheme for retrieving semi-structured documents |
US6067548A (en) * | 1998-07-16 | 2000-05-23 | E Guanxi, Inc. | Dynamic organization model and management computing system and method therefor |
US6370542B1 (en) * | 1998-10-23 | 2002-04-09 | Qwest Communications International, Inc. | Method and apparatus for knowledge acquisition and management |
US6498795B1 (en) * | 1998-11-18 | 2002-12-24 | Nec Usa Inc. | Method and apparatus for active information discovery and retrieval |
US6442566B1 (en) * | 1998-12-15 | 2002-08-27 | Board Of Trustees Of The Leland Stanford Junior University | Frame-based knowledge representation system and methods |
US6904423B1 (en) * | 1999-02-19 | 2005-06-07 | Bioreason, Inc. | Method and system for artificial intelligence directed lead discovery through multi-domain clustering |
US6292796B1 (en) * | 1999-02-23 | 2001-09-18 | Clinical Focus, Inc. | Method and apparatus for improving access to literature |
US6581038B1 (en) | 1999-03-15 | 2003-06-17 | Nexcura, Inc. | Automated profiler system for providing medical information to patients |
US6741976B1 (en) * | 1999-07-01 | 2004-05-25 | Alexander Tuzhilin | Method and system for the creation, application and processing of logical rules in connection with biological, medical or biochemical data |
AU6611900A (en) * | 1999-07-30 | 2001-03-13 | Agy Therapeutics, Inc. | Techniques for facilitating identification of candidate genes |
US6598043B1 (en) * | 1999-10-04 | 2003-07-22 | Jarg Corporation | Classification of information sources using graph structures |
US7022905B1 (en) * | 1999-10-18 | 2006-04-04 | Microsoft Corporation | Classification of information and use of classifications in searching and retrieval of information |
GB2363874B (en) * | 1999-11-06 | 2004-08-04 | Dennis Sunga Fernandez | Bioinformatic transaction scheme |
JP2001134600A (ja) | 1999-11-08 | 2001-05-18 | Nec Corp | 情報抽出システム、情報抽出方法および情報抽出用プログラムを記録した記録媒体 |
EP1158447A1 (en) * | 2000-05-26 | 2001-11-28 | GMD- Forschungszentrum Informationstechnik GmbH | Method for evaluating states of biological systems |
EP1264249A1 (en) | 2000-01-27 | 2002-12-11 | Informax, Inc. | Integrated access to biomedical resources |
US20030171876A1 (en) * | 2002-03-05 | 2003-09-11 | Victor Markowitz | System and method for managing gene expression data |
US20010049671A1 (en) * | 2000-06-05 | 2001-12-06 | Joerg Werner B. | e-Stract: a process for knowledge-based retrieval of electronic information |
US7577683B2 (en) * | 2000-06-08 | 2009-08-18 | Ingenuity Systems, Inc. | Methods for the construction and maintenance of a knowledge representation system |
US6741986B2 (en) * | 2000-12-08 | 2004-05-25 | Ingenuity Systems, Inc. | Method and system for performing information extraction and quality control for a knowledgebase |
US6772160B2 (en) * | 2000-06-08 | 2004-08-03 | Ingenuity Systems, Inc. | Techniques for facilitating information acquisition and storage |
AU2001278089A1 (en) * | 2000-07-31 | 2002-02-13 | Agilix Corporation | Visualization and manipulation of biomolecular relationships using graph operators |
US20020183936A1 (en) * | 2001-01-24 | 2002-12-05 | Affymetrix, Inc. | Method, system, and computer software for providing a genomic web portal |
GB0108080D0 (en) * | 2001-03-30 | 2001-05-23 | Univ Bath | Audio compression |
US20020194201A1 (en) * | 2001-06-05 | 2002-12-19 | Wilbanks John Thompson | Systems, methods and computer program products for integrating biological/chemical databases to create an ontology network |
US20030018522A1 (en) * | 2001-07-20 | 2003-01-23 | Psc Scanning, Inc. | Biometric system and method for identifying a customer upon entering a retail establishment |
EP1490822A2 (en) | 2002-02-04 | 2004-12-29 | Ingenuity Systems Inc. | Drug discovery methods |
US8793073B2 (en) * | 2002-02-04 | 2014-07-29 | Ingenuity Systems, Inc. | Drug discovery methods |
US7865534B2 (en) * | 2002-09-30 | 2011-01-04 | Genstruct, Inc. | System, method and apparatus for assembling and mining life science data |
AU2003298668A1 (en) * | 2002-11-20 | 2004-06-15 | Genstruct, Inc. | Epistemic engine |
WO2005003308A2 (en) * | 2003-06-25 | 2005-01-13 | Smithkline Beecham Corporation | Biological data set comparison method |
US7505989B2 (en) * | 2004-09-03 | 2009-03-17 | Biowisdom Limited | System and method for creating customized ontologies |
US7914468B2 (en) * | 2004-09-22 | 2011-03-29 | Svip 4 Llc | Systems and methods for monitoring and modifying behavior |
US20060143082A1 (en) * | 2004-12-24 | 2006-06-29 | Peter Ebert | Advertisement system and method |
US20070282632A1 (en) * | 2006-05-30 | 2007-12-06 | Eric Sachs | Method and apparatus for serving advertisements in an electronic medical record system |
US20080033819A1 (en) * | 2006-07-28 | 2008-02-07 | Ingenuity Systems, Inc. | Genomics based targeted advertising |
US8140270B2 (en) * | 2007-03-22 | 2012-03-20 | National Center For Genome Resources | Methods and systems for medical sequencing analysis |
US20110098193A1 (en) * | 2009-10-22 | 2011-04-28 | Kingsmore Stephen F | Methods and Systems for Medical Sequencing Analysis |
-
2003
- 2003-02-03 EP EP03706023A patent/EP1490822A2/en not_active Ceased
- 2003-02-03 EP EP19189381.7A patent/EP3633680A1/en not_active Withdrawn
- 2003-02-03 JP JP2003566780A patent/JP4594622B2/ja not_active Expired - Fee Related
- 2003-02-03 US US10/502,420 patent/US8489334B2/en active Active
- 2003-02-03 AU AU2003207786A patent/AU2003207786B2/en not_active Expired
- 2003-02-03 CA CA2474754A patent/CA2474754C/en not_active Expired - Lifetime
- 2003-02-03 WO PCT/US2003/003006 patent/WO2003067504A2/en active Application Filing
-
2009
- 2009-12-16 AU AU2009250971A patent/AU2009250971B2/en not_active Expired
-
2013
- 2013-06-10 US US13/914,419 patent/US10453553B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
WO2003067504A2 (en) | 2003-08-14 |
AU2009250971B2 (en) | 2012-02-02 |
WO2003067504A3 (en) | 2004-09-30 |
US10453553B2 (en) | 2019-10-22 |
CA2474754A1 (en) | 2003-08-14 |
US20060036368A1 (en) | 2006-02-16 |
EP1490822A2 (en) | 2004-12-29 |
CA2474754C (en) | 2022-03-22 |
US8489334B2 (en) | 2013-07-16 |
EP3633680A1 (en) | 2020-04-08 |
JP2006501531A (ja) | 2006-01-12 |
AU2009250971A1 (en) | 2010-01-14 |
US20140121120A1 (en) | 2014-05-01 |
AU2003207786B2 (en) | 2009-09-17 |
AU2003207786A1 (en) | 2003-09-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4594622B2 (ja) | 薬発見法 | |
JP2006501531A5 (ja) | ||
US20190164630A1 (en) | Drug discovery methods | |
AU2017338775B2 (en) | Phenotype/disease specific gene ranking using curated, gene library and network based data structures | |
US10275711B2 (en) | System and method for scientific information knowledge management | |
Alves et al. | Gene association analysis: a survey of frequent pattern mining from gene expression data | |
JP5464503B2 (ja) | 医療分析システム | |
US8364665B2 (en) | Directional expression-based scientific information knowledge management | |
McIntosh et al. | High confidence rule mining for microarray analysis | |
CA2583879A1 (en) | Method, system and apparatus for assembling and using biological knowledge | |
Soldatos et al. | How to learn about gene function: text-mining or ontologies? | |
Chen et al. | How will bioinformatics impact signal processing research? | |
Azencott | Network-Guided Biomarker Discovery | |
Linkowski et al. | Gene sets analysis using network patterns | |
Cappelli | Big biomedical data modeling for knowledge extraction with machine learning techniques | |
Nussbaumer et al. | TraitCorr–correlating gene expression measurements with phenotypic data | |
Yu | Hierarchical Models of Biological Systems | |
Ramakrishnan | A data cleaning and annotation framework for genome-wide studies | |
Dubitzky | M1: Introduction to Systems Biology | |
Pandya | Binary representation of DNA sequences towards developing useful algorithms in bioinformatic data-mining | |
Kranz | Integration and visualisation of results from analyses of microarray gene expression data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060124 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090130 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20090401 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20090408 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20090617 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20090624 |
|
A524 | Written submission of copy of amendment under article 19 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A524 Effective date: 20090730 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100129 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20100421 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20100428 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20100528 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20100604 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20100628 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20100705 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100728 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20100721 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100907 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100917 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130924 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4594622 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |