FI117068B - Informaationhallintajärjestelmä biokemiallista informaatiota varten - Google Patents
Informaationhallintajärjestelmä biokemiallista informaatiota varten Download PDFInfo
- Publication number
- FI117068B FI117068B FI20031026A FI20031026A FI117068B FI 117068 B FI117068 B FI 117068B FI 20031026 A FI20031026 A FI 20031026A FI 20031026 A FI20031026 A FI 20031026A FI 117068 B FI117068 B FI 117068B
- Authority
- FI
- Finland
- Prior art keywords
- management system
- variable
- information management
- data
- information
- Prior art date
Links
- 230000003993 interaction Effects 0.000 claims description 26
- 230000014509 gene expression Effects 0.000 claims description 23
- 108090000623 proteins and genes Proteins 0.000 claims description 22
- 239000011159 matrix material Substances 0.000 claims description 15
- 238000012800 visualization Methods 0.000 claims description 7
- 230000006870 function Effects 0.000 claims description 6
- 230000008236 biological pathway Effects 0.000 claims description 4
- 238000010586 diagram Methods 0.000 claims description 4
- 150000001875 compounds Chemical class 0.000 claims description 3
- 206010061218 Inflammation Diseases 0.000 claims 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 claims 1
- 230000002068 genetic effect Effects 0.000 claims 1
- 230000004054 inflammatory process Effects 0.000 claims 1
- 229910052760 oxygen Inorganic materials 0.000 claims 1
- 239000001301 oxygen Substances 0.000 claims 1
- 230000001575 pathological effect Effects 0.000 claims 1
- 239000012620 biological material Substances 0.000 description 29
- 238000002474 experimental method Methods 0.000 description 22
- 238000000034 method Methods 0.000 description 15
- 238000012360 testing method Methods 0.000 description 14
- 230000008901 benefit Effects 0.000 description 12
- 238000006243 chemical reaction Methods 0.000 description 11
- 210000004027 cell Anatomy 0.000 description 10
- 238000005259 measurement Methods 0.000 description 9
- 108020004999 messenger RNA Proteins 0.000 description 9
- 238000005070 sampling Methods 0.000 description 9
- 102000004169 proteins and genes Human genes 0.000 description 8
- 239000000758 substrate Substances 0.000 description 8
- 230000008569 process Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 6
- 230000037361 pathway Effects 0.000 description 5
- 230000007704 transition Effects 0.000 description 5
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 4
- 230000027455 binding Effects 0.000 description 4
- 238000009739 binding Methods 0.000 description 4
- 210000000056 organ Anatomy 0.000 description 4
- 230000008520 organization Effects 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 230000014616 translation Effects 0.000 description 4
- 108091026890 Coding region Proteins 0.000 description 3
- UELITFHSCLAHKR-UHFFFAOYSA-N acibenzolar-S-methyl Chemical compound CSC(=O)C1=CC=CC2=C1SN=N2 UELITFHSCLAHKR-UHFFFAOYSA-N 0.000 description 3
- 210000003050 axon Anatomy 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000000126 in silico method Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 101000633608 Homo sapiens Thrombospondin-3 Proteins 0.000 description 2
- 102100029524 Thrombospondin-3 Human genes 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 238000001994 activation Methods 0.000 description 2
- 150000001413 amino acids Chemical class 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 239000011230 binding agent Substances 0.000 description 2
- 238000007418 data mining Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000004907 flux Effects 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 210000000130 stem cell Anatomy 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 101150084750 1 gene Proteins 0.000 description 1
- 101150110188 30 gene Proteins 0.000 description 1
- 241000499489 Castor canadensis Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 235000011779 Menyanthes trifoliata Nutrition 0.000 description 1
- 241000982367 Numenes Species 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 244000269722 Thea sinensis Species 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 230000000172 allergic effect Effects 0.000 description 1
- 208000010668 atopic eczema Diseases 0.000 description 1
- 230000008238 biochemical pathway Effects 0.000 description 1
- 229960000074 biopharmaceutical Drugs 0.000 description 1
- 230000032823 cell division Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 150000005829 chemical entities Chemical class 0.000 description 1
- OEYIOHPDSNJKLS-UHFFFAOYSA-N choline Chemical compound C[N+](C)(C)CCO OEYIOHPDSNJKLS-UHFFFAOYSA-N 0.000 description 1
- 229960001231 choline Drugs 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000006071 cream Substances 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 238000013079 data visualisation Methods 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000003205 genotyping method Methods 0.000 description 1
- 239000008187 granular material Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 238000001871 ion mobility spectroscopy Methods 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000002969 morbid Effects 0.000 description 1
- 210000000944 nerve tissue Anatomy 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000035484 reaction time Effects 0.000 description 1
- 230000008672 reprogramming Effects 0.000 description 1
- 238000007423 screening assay Methods 0.000 description 1
- 230000035807 sensation Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000001612 separation test Methods 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 210000002460 smooth muscle Anatomy 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000005309 stochastic process Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
Landscapes
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medical Informatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Bioethics (AREA)
- Databases & Information Systems (AREA)
- Molecular Biology (AREA)
- Physiology (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Epidemiology (AREA)
- Evolutionary Computation (AREA)
- Public Health (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Description
y 4
Informaationhallintajärjestelmä biokemiallista informal varten
Keksinnön tausta
Keksintö liittyy informaationhallintajäijestelmään (lyhyesti 5 formation management system)) biokemiallisen informaation hallin Tarkemmin sanottuna keksintö liittyy informaationhallintajärjestelmäi erityisesti sovitettu kuvaamaan biologisia potkuja (pathway).
Biologinen tutkimus tuottaa valtavia datamääriä nopeudu ole koskaan nähty millään tieteen alalla. Keksinnön pohjana olev 10 liittyy vaikeuksiin järjestää valtavia määriä nopeasti vaihtuvaa inf< IMS-järjestelmät voivat olla vapaamuotoisia tai strukturoituja. Eräs nettu esimerkki vapaamuotoisesta IMS:stä on tutkimusinstituutin johon informaation tuottajat (tutkijat tms.) voivat syöttää informaatio täisessä muodossa käyttämällä mitä tahansa yleisesti saatavilla ole 15 tälöityjä sovellusohjelmia, kuten tekstinkäsittely-, taulukkolaskenta-1 taohjelmia. Strukturoitu IMS tarkoittaa järjestelmää, jossa on jäijest juiset säännöt informaation tallentamiseksi yhtenäiseen tietokantaan
Keksinnön perustana oleva erityinen ongelma liittyy biol< kuihin ("pathway”). Biologiset polut ovat jossakin määrin analogisia 20 ten piirien piirikaavioiden kanssa. Tunnetuissa IMS-järjestelmissä p . tään tyypillisesti käsin, mikä on virhealtista ja aikaa vievää. Lisäksi k λ ; tyjä polkuja ovat vaikea analysoida tietokoneilla.
*
Keksinnön pohjana oleva spesifinen ongelma on vähenU
***! määrää biologisia polkuja kehitettäessä.
• * V\: 25 Keksinnön lyhyt selostus
Keksinnön tavoitteena on tuottaa informaationhallinta (jäljempänä lyhennetty "IMS”) yllä mainittujen haittojen lieventämisc : sanoen keksinnön tavoitteena on tuottaa IMS, joka tukee biologiste • · ·
.***. automaattista prosessointia. Keksinnön tavoite saavutetaan IMS:II
2 olla todellisen elämän koe fmärkälaboratorio”) tai simuloitu koe Keksinnön mukaisesti molemmat koetyypit tuottavat datajoukkoja hunkin kuuluu: • muuttuja-arvomatriisi, joka sisältää riveiksi ja sarakkeik 5 tyjä muuttuja-arvoja; - muuttujankuvauskielellä oleva rivienkuvauslista arvomatriisin riveistä; - muuttujankuvauskielellä oleva sarakkeidenkuvauslisti arvomatriisin sarakkeista; 10 - muuttujankuvauskielellä oleva kiinteiden dimensioiden destä tai useammasta kiinteästä dimensiosta, jotka ovat yhteisö arvomatriisin kaikille arvoille.
Kunkin kokeen numeeriset arvot talletetaan edullisesti sinä muuttuja-arvomatriisiin, jossa on rivi-sarake -organisaatio. Ti 15 sarake -matriiseja voidaan käsitellä edelleen hyvin monilla erilaisilla räätälöidyillä sovellusohjelmilla. On erilliset rivi- ja sarakekuvausli maan, vastaavasti, muuttuja-arvomatrilsissa olevien rivien ja sarakl· kitystä. Rivi- ja sarakekuvauslistat sekä kiinteiden dimensioiden kuv taan muuttujankuvauskielellä mielivaltaisten muuttuja-arvojen linl 20 IMS:n strukturoituun informaatioon.
. .·. Muuttujankuvauskielen (variable description language = • * * V\a tämisellä saavutetaan se etu, että IMS on pitkälti itseriittoinen. Nun *;./ tulkitsemiseen tarvitaan vähän tai ei lainkaan ulkopuolista inform • · *···* myös suhteellisen suoraviivainen tehtävä kohdistaa muuttujalausel 25 koliinen automaattinen syntaksintarkastus. Eräs VDL:n oleellinen pii : se sallii muuttujien kuvaamisen muuttuvalla detaljitasolla. VDL voi ··· kuvata muuttujan biomateriaalitermein (populaatio - yksilö - näyte; elin - kudos, solutyyppi, jne.), fyysisinä määrinä ja aikana, mutta voi : pois detaljeja, jotka eivät ole nykyiselle kontekstille oleellisia.
····· 30 XML (extendible Markup Lanauaae) on eräs hvvin tu 3 sen biologisilla tai matemaattisilla varianteilla, kuten SBML (Syster Markup Language) tai CellML (Cell Markup Language) tai MathML ticai Markup Language), ovat yleensä liian pitkiä tai monimutkaisia te itse dokumentoivina symboleina biologisten muuttujien kuvaamis 5 maattisissa malleissa. Näin ollen keksinnön vielä eräs edullinen suo käsittää kompaktin mutta laajennettavan VDL:n, joka ratkaisee näm sen varianttien ongelmat.
Tallettamalla numeroarvot skalaarimatriisina saavutetaan tä matriisi voidaan analysoida monilla kaupallisesti saatavilla datar 10 kaluilla (data mining tools), kuten itsejäijestyvillä kartoilla klusterointialgoritmeilla, jotka eivät helposti prosessoi arvoja, joissa sioita. Niinpä rivi- ja sarakekuvaukset talletetaan erikseen. Talletti mas lista, nimittäin kiinteiden dimensioiden kuvaus, saavutetaan s riveille ja sarakkeille yhteisiä dimensioita ei tarvitse toistaa rivi- ja 15 vauslistoissa.
IMS:n käsittelynopeutta voidaan lisätä tallettamalla kukin i (kukin datajoukko käsittää muuttuja-arvomatriisin, rivi- ja sarakek sekä kiinteiden dimensioiden kuvauksen) datan säiliönä ja tallettar kantaan vain tämän säiliön osoite tai tunniste. Olettaen, että dat 20 noutamiseen käytetään SQL- (structured query language) tai muita kyselyjä, yhden säiliön tekniikka vähentää dramaattisesti SQL-kys : sessoitavien yksittäisten dataelementtien määrää. Kun yksittäisiä da tejä tarvitaan, koko säiliö voidaan prosessoida sopivalla työkalulla, * · lukkolaskennalla tai yksinkertaisten tiedostojen (flat file) tietokantajä 25 ia.
• · ;v. Keksinnön erään toisen edullisen suoritusmuodon muka käsittää lisäksi biokemiallisten olioiden tietokannan, joka sisältää olic *"** lukoita. Muuttujankuvauskieli käsittää muuttujakuvauksia, joista kuk yhden tai useamman avainsana-nimiparin. Kutakin biokemiallista 30 tietokannassa olevaa oliota tai taulukkoa kohti on siihen viittaava ; 9 9* Tämä suoritusmuoto hainottaa automaattista syntaksin tai muuta t; 4
Kuvioiden lyhyt selostus
Keksintöä selostetaan nyt lähemmin edullisten suoritusm teydessä, viitaten oheisiin piirroksiin, joista:
Kuvio 1 on lohkokaavio IMS:$tä, jossa keksintöä voidaan 5 Kuvio 2 on IMS:n tietokantarakenteen olio-relaatiomalli;
Kuviot 3A ja 3B esittävät edullista muuttujankuvauskieltä < Kuvio 3C esittää VDL-kielisen muuttujalausekkeen tarkastusprosessia;
Kuvio 4 näyttää esimerkkejä VDL-kielisistä yhdistetyistä 10 lausekkeista;
Kuvio 5 näyttää, kuinka VDL:ää voidaan käyttää ilmaiser siä datakonteksteja;
Kuviot 6A ja 6B esittävät keksinnön mukaisia datajoukkoj; Kuvio 7A on IMS.ään tallennetun polun (pathway) lohkota 15 Kuvio 7B näyttää esimerkin monimutkaisesta polusta, jo yksinkertaisempia polkuja;
Kuvio 8 näyttää polun visualisoitua muotoa;
Kuvio 9 esittää koe-oliota IMS:n koeosiossa;
Kuvio 10 näyttää esimerkin IMS:n biomateriaaliosion ob 20 sesta toteutuksesta;
Kuviot 11A ja 11B osoittavat datan seurattavuutta kahdet :.:,ί valossa;
Kuvio 12A näyttää ohjelmisto-komponenttimallia moni työvirtojen selostamiseksi ja hallitsemiseksi IMS:ssä;
Ml ·:··· 25 Kuvio 12B näyttää asiakas-palvelin -arkkitehtuurin, joi :\\ asiakaspäätelaitteessa CT suoritettava graafinen työvirtojen editori; !'··. Kuvio 13 esittää prosessia polkujen automaattista täyttän • * sekvenssitietokannasta; ja . Kuvio 14 esittää spatiaalista referenssimallia erilaisille soi i · · i · # ***** Vt l^alrelnnÄn Ι/Loituiel/nhfeΐηΑη «αΙμιΦιie 5 graafisilla työasemilla, on pääsy palvelimeen (tai palvelinten joukkc kon NW, kuten lähiverkon tai Internetin kautta. Palvelimeen kuului on kytketty tietokanta DB. Palvelimen informaationkäsittelylogiikka j nan data muodostavat IMS:n. Tietokanta muodostuu rakenteesta j£ 5 Keksinnön eräs edullinen suoritusmuoto tuo parannuksia IMS:n t DB rakenteeseen. Palvelin S käsittää myös erilaisia prosessoir Viestilogiikka tarjoaa palvelimen perustoiminnot asiakaspäätelaittek viestintää varten. On myös edullisesti käyttöliittymälogiikka erilaiste tyrnien luomiseksi. Voi olla erilaisia tarkastuksia syötettävän datai 10 vyyden tarkastamista varten (kuten syntaksi· tai aluetarkastuksia). hyödyllinen piirre on projektihallitsija, jolla on seurantalogiikka, joka tan visuaalisen seurannan.
Palvelin (tai palveiinjoukko) S käsittää myös erilaisia c sointityökaluja datan analysointia, visualisointia ja etsimistä (minii 15 ym. Tallentamalla datajoukot säiliöinä rivi-sarake -organisaatiossa (< ta jokaista data-alkiota erikseen SQL-kyselyillä) saavutetaan se etu set rivien ja sarakkeiden datajoukot voidaan helposti prosessoida k saatavilla analyysi- tai visualisointityökaluilla. Muita suoritusmuotoja en osapuolten työkalujen integroimiseksi yhteisen käyttöliittymän t 20 selostetaan kuvion 12 yhteydessä.
. .·. Datajoukot ***1 : Kuvio 2 on IMS:n tietokantarakenteen 200 olio-relaation • A* kantarakenne 200 käsittää seuraavat pääosat: perusmuuttujat/yl • · datajoukot 202, kokeet 208, biomateriaalit 210, polut 212 ja valin .. .* 25 jainnrt214.
• * *
Datajoukot 202 kuvaavat IMS:ään tallennettuja numeeri *— Kukin datajoukko koostuu muuttujajoukosta, biomateriaali-inform ajasta. Huomattakoon, että perusmuuttujat/yksiköt -osasta 204 ja 206 on monesta moneen -relaatiot datajoukko-osaan 202. Tämä sn eitä kukin dataimikkn käsittää twnillisocti vhHnn tai usAamn 11 6
Perusmuuttujat/yksiköt -osa 204 kuvaa IMS:ssä käytetyt \ tujat ja yksiköt. Erässä yksinkertaisessa toteutuksessa kukin peru tietue käsittää yksikkökentän, mikä tarkoittaa, että kukin perusmuul massa) voidaan ilmaista vain yhdessä yksikössä (esim. kilogrammo 5 tavammassa suoritusmuodossa yksiköt tallennetaan erilliseen tau sallii perusmuuttujien ilmaisemisen useassa yksikössä, kuten kilof tai nauloina.
Perusmuuttujat ovat muuttujia, joita voidaan käyttää sella niitä voidaan yhdistää muodostamaan monimutkaisempia muuttujia 1 o tyn näytteen konsentraatio tietyllä ajanhetkellä.
Aikaosa 206 tallentaa datajoukkojen 202 aikakomponenti kon aikakomponentti käsittää edullisesti suhteellisen (sekuntikello-) soluuttisen (kalenteri-) ajan. Suhteellista aikaa voidaan käyttää esinr vaarnaan nopeutta, jolla kemiallinen reaktio tapahtuu. On myös pe 15 tallentaa absoluuttinen aika kunkin datajoukon yhteydessä. Absolut osoittaa koska kalenteriajassa vastaava tapahtuma esiintyi. Tällaista tisen ajan informaatiota voidaan käyttää laskemaan suhteellinen s tahansa koetapahtumien välillä. Sitä voidaan käyttää myös vianet fuksiin. Jos esimerkiksi havaitaan viallinen instrumentti tiettynä a 20 tuolla instrumentilla tehdyt kokeet ennen vian havaitsemista tulisi tail
Koeosa 208 tallentaa kaikki IMS:n tuntemat kokeet. On k : den päätyyppiä, joista käytetään yleisesti nimitystä märkälaboral silico. Mutta datajoukkojen 202 suunnasta nähtynä kaikki kokeet nä • · .···. moilta. Koeosa 208 toimii siltana datajoukkojen 202 ja kokeiden ka .!!!: 25 tyypin välillä. Jo suoritettujen kokeiden lisäksi koeosaa 208 voida ··.·, tallentamaan tulevia kokeita. Kokeiden edullisia objektiperustaisia i \.f selostetaan kuvion 9 yhteydessä. Koeosan eräs tärkeä suunnittek datan seurattavuus, kuten kuvion 11 yhteydessä lähemmin selosteta
Biomateriaaliosa 210 sisältää tietoa populaatioista, 30 reagenteista tai muiden biomateriaalien näytteistä (mitä tahansa, jo tutkia bioloaisena järjestelmänä tai sen komoonenttinal IMS:ssä Bio 7
Biomateriaaliosa 210 kuvaa reaalimaailman biomateriaa polkuosa 212 kuvaa biomateriaalien teoreettisia malleja. Biokemia ovat jossakin määrin analogisia elektronisten piirien piirikaavioidc Polut voidaan kuvata IMS:ssä monella tavalla, mutta kuvio 2 esi 5 edullisen toteutuksen pääpiirteet. Kuvion 2 esimerkissä kukin polku tää yhden tai useamman yhteyden 216, joista kukin liittyy yhteen paan biokemialliseen olioon 218 ja yhteen interaktioon 222.
Biokemialliset oliot tallennetaan biokemiallisten olioiden o Kuvion 2 esimerkissä kukin biokemiallinen olio on luokkaobjekti, joi 10 kat ovat geeni 218-1, transkripti 218-2, proteiini 218-3, makromole leksi 218-4 ja yhdiste 218-5. Edullisesti on myös optio tallentaa < heräte 218-6, kuten lämpötila, jolla on potentiaalisia yhteyksiä inter potentiaalisia vaikutuksia relevantteihin kineettisiin lakeihin.
Tietokantaviiteosa 220 toimii siltana ulkoisiin tietokanto 15 tietokantaviite osassa 220 on relaatio sisäisen biokemiallisen olion koisen tietokannan olion välillä, kuten Affymetrix Inc. -yhtiön spesifii joukko.
Interaktio-osa 222 sisältää biokemiallisten olioiden välisiä ta, mukaanlukien reaktioita. Kineettisten lakien osa 224 kuvaa (hypo 20 kokeellisesti varmennettuja) kineettisiä lakeja, jotka vaikuttavat int Polkujen edullisia ja yksityiskohtaisempia toteutuksia selostetaan kw 7B ja 8 yhteydessä.
Keksinnön erään edullisen suoritusmuodon mukaisesti IM .···. myös paikkatietoa 214. Paikkatietoon viitataan biomateriaaliosasta .!!!: 25 kuosasta 122. Esimerkiksi biomateriaaleihin liittyvän informaation s :v. viossa 2 näytetty organisaatio sallii minkä tahansa detaljitason tai 1 yhtäältä populaation ja toisaalta solun spatiaalisen pisteen (koor ’··1' välillä. Kuviossa 2 näytetyssä esimerkissä paikkatieto käsittää organ 1 (esimerkiksi ihminen), elimen 214-2 (esim. sydän, mahalaukku), 30 214-3 (esim. sileä lihaskudos, hermokudos), solutyypin 214-4 (esin *·» 1 taalicnliri Qnlun nca 214-5 (&n tuma crJiiIima\ ia auon n icnictoAn 21, 8 automaattiseen syntaksintarkastukseen. On siis mahdotonta tallen' tietoa, joka viittaa väärinkirjoitettuun tai olemattomaan elimeen tai or Keksinnön erään toisen edullisen suoritusmuodon muka katieto voi käsittää myös spatiaalista tietoa 214-6, kuten spatiaalis 5 organismi-soluhierarkian kaikkein detaljoiduimmassa paikassa. Jc detaljoiduin paikka osoittaa spesifistä solua tai solun osaa, niin s piste voi edelleen määrittää kyseistä tietoa relatiivisina spatiaalis naatteina. Solutyypistä riippuen spatiaaliset koordinaatit voivat olh maisia tai napakoordinaatteja.
10 Eräs tällaisen paikkatiedon etu on parempi ja systemaa verrata paikkoja näytteissä ja teoreettisissa rakenteissa, kuten pok on varmennettava relevanteilla mittaustuloksilla.
Muuttujankuvauskieli
Kuviot 3A ja 3B esittävät edullista muuttujankuvauskieltä 15 Yleisesti ottaen muuttuja on mitä tahansa, jolla on arvo ja joka edus sen järjestelmän tilaa (joko tosielämän biomateriaalia tai teoreetti;
Kun IMS otetaan käyttöön, suunnittelija ei tiedä, minkälaisia bion tullaan kohtaamaan tai minkälaisia kokeita tullaan suorittamaan tai siä näistä kokeista tullaan saamaan. Niin ollen muuttujakuvauster 20 avoimia tuleville laajennuksille. Toisaalta avoimuus ja joustavuus ei\ ; taa anarkiaan, minkä vuoksi tulisi varmistaa, että muuttujakuvauks taan hyvin määriteltyjä sääntöjä. Nämä tarpeet tyydytetään parhai
.»**! nettavalla muuttujankuvauskielellä (variable description language, V
• * **\ Esimerkiksi extendible markup language (XML) on eräs .* 25 laajennettavasta kielestä, jota voitaisiin periaatteessa käyttää kuva< * · · logisia muuttujia. Tietokoneet tulkitsevat XML-lausekkeita melko hel| lausekkeet pyrkivät kuitenkin olemaan hyvin pitkiä, minkä vuoksi il vaikea lukea niitä. Sen vuoksi tarvitaan laajennettavaa VDL:ää, jol· paktimpi ja ihmisille ja tietokoneille helppolukuisempi kuin XML.
! · W I aaiannaHQuan \/ΠΙ -n S Haa nn ottS ealliHaiiat mmiHiiia 9 kaaoksen välillä voidaan toteuttaa tallentamalla sallittavat muuttuja-tietorakenteeseen, kuten datatauluun tai tiedostoon, joka on muut man uudelleenohjelmointia. Normaaleja pääsynhallintatekniikoita vo tää määrittämään, mitkä käyttäjät ovat valtuutettuja lisäämään uusi 5 muuttuja-avainsanoja.
Kuvio 3A esittää muuttujalauseketta edullisella VDL:llä. k seke 30 käsittää yhden tai useamman avainsana-nimiparin 31, jotki tu rajorttimilla. Kuten kuvion 3A esimerkissä näytetään, kukin nimipari 31 koostuu avainsanasta 32, avaavasta rajoittimesta (kuten 10 hakasulusta) 33, (muuttujan) nimestä 34 ja sulkevasta rajoittimesta kevasta hakasulusta) 35. Esimerkiksi ^[2002-11-26 18:00:00]” (i usmerkkejä) on esimerkki aikaleimasta. Jos on useita avainsana 31, niin parit voidaan erottaa erottimella 36, kuten välilyönnillä ti prepositiolla. Erotin ja toinen avainsana-nimipari 31 on piirretty ks 15 koska ne ovat valinnaisia. Elementtien 32 - 36 väliset &-merkil merkkijonoyhdistämistä. Toisin sanoen &-merkit eivät sisälly muutti seen.
Mitä kielen syntaksiin tulee, niin muuttujankuvaus voi käi vattaisen määrän avainsana-nimipareja 31. Mutta mielivaltainen pa 20 distelmä, kuten esimerkiksi ajan konsentraatio, ei ehkä ole semani lekäs.
Kuvio 3B esittää tyypillisten avainsanojen taulukkoa. T; kunkin merkinnän vieressä on sen selkokielinen kuvaus 38’ja hava * *
·’**. esimerkki 38”. Huomattakoon, että taulukko 38 on tallennettu IMS
25 muita taulukoita 38’ ja 38” ei välttämättä ole tallennettu (niiden t •v. vain selventää taulukon 38 kunkin avainsanan merkitystä). Esimeri * « _ sanan T esimerkki on ^-2.576-3^ joka on yksi tapa ilmaista r '***' millisekuntia ennen referenssiaikaa. Referenssiaika voidaan osc leiman avainsanalla Ts”.
4 :·ί-: 30 Avainsanat ”T ja Ts” toteuttavat vastaavasti suhteellise ···
Λ Λ Kv 11A \ AlAM IA aI^AaIiII lUlAAA /ΙιμΙμηΑα·· \ AIAA IKa* aLaA AA aIIa aiiL
11 10
Tallentamalla IMS:n taulukkoon 38 merkintä kutakin avainsanaa kohti on mahdollista pakottaa syötettäville muuttujille i nen syntaksintarkastus, kuten kuviossa 3C näytetään.
Edullisen VDL:n syntaksi voidaan ilmaista formaalisti s 5 tavalla: <muuttujan kuvaus>: :=<avainsana>T<nimi>T{{erotin}<avainsana>T<niiT>i>1"}<lopi <avainsana>::=<jokin ennalta määrätty avainsana, ks. esim. taulu 38> <nimi>::=<merkkijono> |*" = mikä tahansa nimi relevantissa datataulussa Eksplisiittisten rajoittimien, kuten”[” ja "]" nimen ympärillä 10 on sallia nimessä mikä tahansa merkki, mukaanlukien välilyönnit < tenkään rajoittimia).
Eräs edullinen avainsanojen joukko 38 käsittää kolmenle sanoja: mitä, missä ja koska. "Mitä” avainsanat, kuten muuttuja, yksi miallinen olio, vuorovaikutus, jne., osoittavat mitä havaittiin tai tulls 15 semaan. "Missä" avainsanat, kuten näyte, populaatio, yksilö, pi osoittavat missä havainto tehtiin tai tullaan tekemään. "Koska” avail ten aika tai aikaleima, osoittavat havainnon aikaa.
Kuvio 3C esittää valinnaista syntaksintarkastusprosessia. VDL:n eräs etu on, että se sallii automaattisen syntaksintarkastuk 20 3C esittää tilakonetta 300 tällaisen syntaksintarkastuksen suorittami koneet voidaan toteuttaa tietokonerutiineina. Alkutilasta 302 lähti avainsana aiheuttaa siirtymän ensimmäiseen välitilaan 304. Mikä tai aiheuttaa siirtymän virhetilaan 312. Ensimmäisestä välitilasta 304 av :***: tin aiheuttaa siirtymän toiseen välitilaan 306. Mikä tahansa muu aih 25 tymän virhetilaan 312.
:v, Avaavan rajoittimen jälkeen nimen osaksi hyväksytään mi • · merkkejä paitsi sulkeva rajoitin, ja tilakone pysyy toisessa välitilassa ***** muuttujalausekkeen ennenaikainen päättyminen aiheuttaa siirtymän , 312. Sulkeva rajoitin aiheuttaa siirtymän kolmanteen välitilaan 308, *;|·: 30 avainsana/nimipari on pätevästi ilmaistu. Pätevä erotinmerkki aiheul *_ · oneimmäieoan uälitilaan 'ίΠΑ Mi n iff· lioloi icalrlraon Inn· in ilmaien aik 11 lausekkeiden paria siten, että kunkin parin ensimmäinen lauseke naisempi ja toinen on kompaktimpi. Tietokoneelle monisanaiset μ lausekkeet ovat samanarvoisia, mutta niitä lukevat ihmiset saattava nisanaista muotoa helpommin ymmärrettävänä. Kuvion 4 lausekk 5 sestään selviä taulukkoon 38 tehtävän viittauksen perusteella. Esirr sekkeet 409 ja 410 määrittelevät reaktionopeuden vuorovaiku 2.7.7.13-PSA1 kautta mooleina litraa ja sekuntia kohti. Viitenumerc taa muuttujalauseketta “νΠΡ[*]ΟΠίΠυΠ”. joka tarkoittaa minkä 1 ganismin minkä tahansa proteiinin mitä tahansa muuttujaa missä 1 10 siköissä. Viitenumerot 415 ja 416 osoittavat kahta erilaista muuttuj; kahdelle erilaiselle ajan ilmaukselle. Muuttujalauseke 415 määritte tunnin aikavälin ja muuttujalauseke 417 määrittelee 10 sekunnin aik alkaa viisi sekuntia ennen aikaleimaa ja päättyy viisi sekuntia sen jä Huomattakoon, että IMS:ää käyttävien ihmisten kielestä 15 on edullista sopia yhteisestä kielestä muuttujalausekkeita varten. \ sesti IMS voi käsittää käännösjärjestelmän muuttujalausekkeider seksi ihmisten eri kielille.
Olennaisesti yllä kuvatun kaltainen VDL on hyvin määrii vain kuviossa 3C näytetyn syntaksintarkastuksen läpäisevät lausekl 20 sytään. VDL on avoin, koska sallitut avainsanat talletetaan taulukko on laajennettavissa. VDL on kompakti, koska avainsanoja varter olennaisesti minimimäärä kiijaimia tai merkkejä. Yleisimmät avain* tuvat yhdestä kirjaimesta, tai kahdesta kirjaimesta, mikäli yhdei :***: avainsana ei ole yksikäsitteinen.
«t· / 25 Datakontekstit • # « :..I* Kuvio 5 näyttää, kuinka VDL:ää voidaan käyttää ilmaiser • ·
*···" siä datakonteksteja eli biologisen tutkimuksen laajuutta (scopes). K
tujat, olivatpa ne sitten näytteitettyjä, mitattuja, mallinnettuja, sin miten tahansa prosessoituja, voidaan ilmaista: * ·* 11 12 a), b) ja c) ovat d:n projektioita, joka on järjestelmän rikl· Kaikki !MS:ssä oleva data on kolmeulotteisessa kontekstiavaruudesi relaatiot: 1. muuttujalistoihin ("mitä”); 5 2. biomateriaalin listoihin ("missä”) ja 3. aikapisteiden tai -intervallien listoihin ("milloin”).
Viitenumero 500 osoittaa yleisesti N + 2 -ulotteista kontek ta, jossa on yksi akseli kullekin muuttujalle (N), biomateriaaleille ja s hyvin yksityiskohtainen muuttujalauseke 510 spesifioi muuttujan (i 10 konsentraatio mooleina litrassa), biomateriaalin (populaatio abcd12? leiman (10.6.2003 klo 12:30). Muuttujan arvo on 1,3 mol/l. Koska m seke 510 spesifioi kontekstiavaruuden kaikki koordinaatit, se esitetä nä 511 kontekstiavaruudessa 500.
Seuraava muuttujalauseke 520 on vähemmän detaljoitu 15 se ei spesifioi aikaa. Siksi muuttujalauseke 520 esitetään ajan fun kontekstiavaruudessa 500.
Kolmas muuttujalauseke 530 spesifioi ajan, mutta ei bion
Sen vuoksi se esitetään kaikkien niiden biomateriaalien jakaumana kuuluvat kokeeseen spesifioituna aikana.
20 Neljäs muuttujalauseke 540 ei spesifioi aikaa eikä bion
Se esitetään ajan funktioiden joukkona 541 ja eri biomateriaalien : joukkona 542.
···
Muuttujankuvauskielen mahdollistamien erilaisten lause .*"! sopivasti jäljestettyjen (seuraavaksi selostettavien) datajoukkojen ai 25 leijoilla on käytännöllisesti katsoen rajattomat mahdollisuudet tutkia .. . järjestelmän aika-tila -avaruutta moniulotteisena stokastisena prose jestelmän probabilistiset aspektit perustuvat relevanttien biomateriaa « · **··* tuma-avaruuteen, ja dynaamiset aspektit perustuvat aika-avaruuteen riaalidata ja aika voidaan rekisteröidä, kun relevantit kokeet dokumer 30 Kaikki kvantitatiiviset mittaukset, data-analyysit, mallit ja • · tulokset voidaan kävttää uudelleen uusissa analwaitekniiknisaa 13 lennetään datajoukkoina. Kuviossa 6A esimerkinomainen datajoul vaa mRNA-molekyylien joukon 610 (on näytetty mRNA1 - mRNA6) tasoja. Datajoukko 610 on yksi esimerkki kuviossa 2 näytettyyn osioon 202 tallennetusta datajoukosta. Datajoukko 610 käsittää ne 5 611-614. Muuttuja-arvomatriisi 614 kuvaa muuttujien arvot -organisaatiossa. Rivienkuvauslista 613 määrittää muuttuja-arvoma merkityksen. Sarakkeidenkuvauslista 612 määrittää muuttuja-arvor rakkeiden merkityksen. Lopuksi, kiinteiden dimensioiden kuvaus 61 yhden tai useamman kiinteän dimension, jotka ovat yhteisiä 10 arvomatriisin 614 kaikille arvoille. Huomattakoon, että muuttuja-614 koostuu skaiaarinumeroista. Muut matriisit 610 - 613 käyttä sisältönsä merkityksen spesifioimiseen.
Kuvio 6A näyttää myös ihmisille luettavan version 615 d 610. Huomattakoon, että datajoukon ihmisille luettava versio 615 15 vain tämän suoritusmuodon parempaa ymmärtämistä varten. Ihm vaa versiota 615 ei välttämättä tallenneta mihinkään, ja se voidaan joukosta 610 automaattisesti, koska tahansa kun tarve tähän esiint luettava versio 615 on esimerkki datajoukoista, kuten taulukkolas dostoista, joita tyypillisesti tallennetaan tunnetuissa IMS:issä bioli 20 musta varten. IMS käsittää edullisesti käyttöliittymälogiikan autorm sisuuntaista muunnosta varten tallennusformaatin 611 - 614 ja ihm : van version 615 välillä.
*· ·
Kuvio 6B esittää toista datajoukkoa 620. Datajoukko 6 * # myös kuuden mRNA-molekyylin ilmentymistasoja, mutta nämä ei\ 25 den eri yksilön ilmentymistasoja vaan yhden populaation ilmentymi jänä eri aikana. Datajoukossa 620 kiinteiden dimensioiden kuvaus oi, että data liittyy tietyn hiivan näytteeseen xyz tiettynä päivänä ja rakkeidenkuvauslista 622 spesifioi, että sarakkeet spesifioivat da ajanhetkelle, nimittäin 0, 30, 60 ja 120 sekuntia kiinteiden dimensii 30 uksen 621 aikaleiman jälkeen. Rivienkuvauslista 623 on hyvin s
•M
*9 i · I n· . ?___ _ « li i . .....
11 14 tiedostojärjestelmässä. Vaihtoehtoisesti muuttuja-arvomatriisi voidac yhtenä osoitettavana datarakenteena, kun taas muut kolme matrii: den dimensioiden kuvaus ja rivi/sarakekuvaukset) voidaan tallent datarakenteena, kuten yhtenä tiedostona, jossa on otsakkeet "yhte 5 ja "sarakkeet”. Eräs avainelementti tässä on se, että muuttuja-arvo letetaan erillisenä datarakenteena, koska se on datajoukon todellis arvoja sisältävä komponentti. Jos numeroarvot tallennetaan erikseei vaan datarakenteeseen, kuten tiedostoon tai taulukkoon, se voida; prosessoida erilaisilla datanprosessointisovelluksilla, kuten tiedonril 10 (data mining) tai vastaavilla. Toinen etu on, että eri matriiseja muodc lisiä dataelementtejä ei tarvitse prosessoida SQL-kyselyillä. SQL-kys vain datajoukon osoitteen tai muun tunnisteen mutta ei erillisiä data jä, kuten matriiseissa 611 - 614 olevia numeroita ja kuvauksia.
Polut 15 Kuvio 7A on IMS:ään tallennetun polun (pathway) lo
Keksinnön mukainen IMS tallentaa kunkin biologisen järjestelmän s na polkumallina 700 järjestelmän komponenteista ja komponenttie yhteyksistä (connections). Järjestelmän komponentteja ovat biokem 218 ja vuorovaikutukset 222. Biokemiallisten olioiden 218 ja vuoroa 20 222 väliset yhteydet 216 tunnistetaan itsenäisiksi objekteiksi, jotka : kunkin biokemiallisen olion roolia (esimerkiksi substraatti, tuote, akt : inhibiittori) kunkin polun kussakin vuorovaikutuksessa. Yhteys voi s ribuUtteja, jotka ovat spesifisiä kullekin biokemialliselle oliolle ja vuo
parille (kuten stökiömetrinen kerroin). Kuten aiemmin todettiin, IM
.! .* 25 edullisesti paikkatietoa, ja kukin polku 212 liittyy bioloogiseen pail * · *
Yksi biologinen paikka voidaan kuvata yhdellä tai useammalla polu *·*·: polkuun sisällytettyjen detaljien tasosta.
Objektipohjaisessa toteutuksessa biokemiallinen polkun tuu kolmeen objektikategoriaan: biokemialliset oliot (molekyylit) 218 30 kutukset f kemialliset reaktiot, transkrintio. translaatio knkoonnano 15 mallin selkeys ja helppo synkronointi, kun useat käyttäjät modifioi polkua yhteys kerrallaan. Käyttöliittymälogiikka voidaan suunnitella 1 potkujen helposti ymmärrettäviä visualisointeja, kuten kuvion 8 yhte laan esittämään.
5 Kineettisten lakien osio 224 kuvaa vuorovaikutuksiin vaiki reettiset tai kokeelliset kineettiset lait. Esimerkiksi vuo substraatis seen reaktioon voidaan ilmaista seuraavalla kaavalla:
VmaxJSjjE] K + |S] missä V on substraatin virtausnopeus, Vmax ja K ovat vak 10 alustan konsentraatio ja [E\ on entsyymin konsentraatio. Reaktionop vaikutuksen läpi voidaan laskea jakamalla vuo substraatin stökiöme toimella.
Biokemiallinen verkko ei välttämättä päde kaikkialla. Toi verkko on tyypillisesti paikkasidonnainen. Sen vuoksi polkujen 212 15 sesti relevanttien diskreettien paikkojen välillä on relaatioita, kuten I ja 7A näytetään.
Monimutkainen polku voi sisältää muita polkuja 700. E 700 yhdistämiseksi malli tukee polkuyhteyksiä 702, joista kuliakin on tiota, jotka selostetaan kuvion 7B yhteydessä.
20 Kuvio 7B näyttää esimerkin monimutkaisesta polusta, jo yksinkertaisempia polkuja. Kaksi tai useampia polkuja voidaan yt :/·: niillä on yhteisiä biokemiallisia olioita, jotka voivat siirtyä sellaisinaa tien paikkojen tai yhteisten vuorovaikutusten välillä (esimerkiksi tra ·:·*: tyyppinen vuorovaikutus, joka siirtää biokemiallisia olioita paikasi :\\ 25 Muussa tapauksessa polkuja pidetään erillisinä.
. * · ·. Viitenumeron 711 osoittama polku A on pääpolku poluille ta osoitetaan vastaavasti viitenumeroilla 712 ja 713. Polut 711-71: aatteessa samanlaisia kuin yllä selostettu polku 700. Kaksi polkuyl ja 730 kytkevät polut B ja C, 712 ja 713, pääpolkuun A, 711. Esim • « 16
Toisella polkuyhteydellä 730 on sekä "pääpolku” etti -relaatiot polkuun A, 711 ja "polkuun” -relaatio polkuun C, 713. Lisä "yhteinen vuorovaikutus" -relaatiot 734, 735 polkuihin B, 712 ja C, tarkoittaa, että polut B ja C jakavat relaatioiden 734 relaatioiden 5 osoittaman vuorovaikutuksen.
Yllä selostettu polkumalli tukee epätäydellisiä malleja, jot rakentaa vaiheittain tietämyksen lisääntyessä. Tutkijat voivat valita i tarpeen vaatiessa. Jotkut polut voidaan kuvata suhteellisen karkei Muut polut voidaan kuvata aina kineettisiin lakeihin ja/tai spatiaali 10 naatteihin asti. Malli tukee myös epätäydellistä informaatiota olemas sekvenssitietokannoista. Esimerkiksi jotkut polkukuvaukset voivs geenin transkription ja translaation erikseen, kun taas muut käsitl yhtenä yhdistettynä vuorovaikutuksena. Kutakin aminohappoa voidi lä erikseen, tai kaikki aminohapot voidaan yhdistää yhteen olioon n 15 nohapot.
Polkumalli tukee myös automaattisia mallinnusprosesse yhtälöitä voidaan muodostaa automaattisesti kunkin biokemiallisen derivaatoille, kun relevantit kineettiset lait ovat käytettävissä kullekii kutukselle. Erityistapauksessa stökiömetrisiä taseyhtälöitä voidaan 20 automaattisesti vuotaseanalyysejä varten. Polkumalli tukee myös - siä päästä-päähän -työvirtoja, mukaanlukien mittausdatan erottamii : tamalla, ylimääräisten rajoitteiden mukaanotto ja yhtälöryhmien rat :erilaisiin data-analyyseihin ja potentiaalisiin automaattisiin merkintöil « · ;**\ Automaattinen polkumallinnus voi perustua polun topoloj 25 muuttujanimien kuvaamiseen käytettäviin VDL-lausekkeisiin, sovel * * neettisiin lakeihin (kuten stökiömetrisiin kertoimiin) ja matemaattisii 4 * siin operaattoreihin ja funktioihin. Parametrit, joita ei tunneta tarkas ***** estimoida tai päätellä mittausdatasta. Oletusyksiköitä voidaan käy kertaistamaan muuttujankuvauskiellsiä lausekkeita. Esimerkiksi: • * « 30 dV[ooncentraiion]C[mannose]/dV[time] = V[fluxJC[mannose]l[EC 2.7.7.13_PSA1] +...
11 17 Tässä yhtälössä biokemialliset oliospesifiset vuot voidaa reaktionopeuksilla, jotka on kerrottu stökiömetrisillä kertoimilla. Täsr kissä stökiömetriset kertoimet ovat ykkösiä, esimerkiksi:
Yhtälöt voidaan kirjoittaa seuraavasti: 5 dV[ooncentration ]C[mannose]/dV[time] = 1*V[readion rateJI[EC 2.7.7.13_PSA1] +...
- 1*V[rection rate]l[ EC... ]-...
dV[concentration ]C[water]/dV[time] = 1*V[reactlon rate]l[EC... ] +...
- 1*V[reaction rate]l[ EC... ] -...
10 Staattisessa tapauksessa derivaatat ovat nollia. Tämä johl tasemalliin: 0 = 1*V[raaction rate]l[EC 2.7.7.13.PSA1] +...
1*V[rectionrate]l[EC... ]-...
15 0 = 1*V[reaction rate]l[EC... ] + ...
- Γ V[reaction rateJII EC... ] - ...
Käyttäjä voi tuottaa omat tavoitefunktionsa ja ylimääräisei tonsa tai mittaustuloksensa, jotka rajoittavat mahdollisten ratkaisujen Vielä eräs edullinen piirre on kyky mallintaa kohinaa vuoti 20 sissä. Voimme lisätä keinotekoisia kohinamuuttujia, jotka tulee min voitefunktiossa. Tämä helpottaa epätarkkojen mittausten hyväksyr : tuullisin tuloksin.
Malli tukee myös visuaalisten polkuratkaisujen (aktiivisten tojen) visualisointia. Yleinen tapaus johtaa tavallisten differentiaali .ΓΙΓ: 25 (ordinary differential equations, ODE) malliin, jossa tarvitaan kineetti ; Ve Niitä voidaan kerätä tietokantaan, mutta voi olla joitakin oletuslakeja, tetään tarvittaessa. Yleisissä yhtälöissä vuorovaikutuskohtaiset real ***** det korvataan kineettisillä laeilla, kuten Michaels-Menten -laeilla, jotl vät entsyymien ja substraattien konsentraatioita. Esimerkiksi: **!·* 30 Vtreadion rate]l[EC 2.7.7.13_PSA1] = 5.2MootH»itral^^ (3.4 + V[conc8ntratlonJC[...]) «** I · • ♦ 18 8.6*V[conoentration ]P[.. ^concentration^
On vaihtoehtoisia toteutuksia. Esimerkiksi yllä tehdyn asemasta voidaan laskea kineettiset lait erikseen ja sijoittaa numen sifisiin reaktionopeuksiin iteratiivisesti.
5 Tällaisen rakenteellisen polkumallin etuna on, että hiera kuja voidaan tulkita tietokoneilla. Esimerkiksi käyttöliittymälogiikkz tuottamaan hierarkkisten polkujen helposti ymmärrettäviä visualisoir kuvion 8 yhteydessä näytetään.
Kuvio 8 näyttää polun visualisoitua muotoa, jota yleisesti 10 viitenumerolla 800. Käyttöliittymälogiikka piirtää visualisoidun polui oissa 1 ja 7A näytettyjen elementtien 212 - 224 perusteella. Ympyr tävät biokemiallisia olioita. Laatikot 820 esittävät vuorovaikutuksii 830 esittävät yhteyksiä. Yhtenäiset nuolet 840 biokemiallisesta olit vaikutukseen esittävät substraattiyhteyksiä, missä vuorovaikutus ki 15 kemiallista oliota. Yhtenäiset nuolet 850 vuorovaikutuksesta biok olioon esittävät tuotosyhteyttä, missä vuorovaikutus tuottaa biokem ta. Katkoviivoin esitetyt nuolet 860 esittävät aktivaatioita, missä bk oliota ei kuluteta eikä tuoteta, mutta se tekee vuorovaikutuksen mi tai kiihdyttää sitä. Katkoviivat 870, joilla on poikittaisviivapää 20 inhibitiota, missä biokemiallista oliota ei kuluteta eikä tuoteta, mut! . vuorovaikutuksen tai hidastaa sitä. Nollasta poikkeavat stökiömeti met assosioidaan substraatti- tai tuotosyhteyksiin 840, 850. Säätö) V*: (esim. aktivaatio 860 tai inhibitio 870) stökiömetriset kertoimet ovat r • » *
Lisäksi biokemiallisten olioiden mitattuja tai säädettyjä *:**: 25 voidaan visualisoida ja paikantaa. Esimerkiksi viitenumero 881 oso :v: miallisen olion konsentraatiota, viitenumero 882 osoittaa vuorovaiki « * aktionopeutta ja viitenumero 883 osoittaa yhteyden virtausta (flux).
• se
Yhteyksien tarkat roolit, vuorovaikutuksiin assosioidut kin . ja kunkin polun biologisesti relevantti paikka tuovat parannuksia t • · · ..I.'' 30 poikumalleihin nähden, esimerkiksi kuvioissa 7A - 8 näytetty malli t 19
Huomattakoon, että viitenumeroilla 200 ja 700 (kuvioiss näytetty tietokantastruktuuri tarjoaa välineet tallentaa biologisen po giaa mutta ei sen visualisointia 800. Visualisointi voidaan generoid asta ja tallentaa myöhemmin, seuraavalla tavalla. Visualisoinnin 800 5 ja keskinäiset yhteydet perustuvat suoraan tallennettuihin polkuihin tettyjen elementtien paikat voidaan aluksi valita ohjelmistorutiinilla, jc jonkin ennalta määrätyn kriteerin, kuten toistensa ylittävien yhteyksie Tällaisia tekniikoita tunnetaan piirilevyjen suunnittelusta. IMS voi tarj jälle graafisia työkaluja visualisoinnin siistimiseksi käsin. Kunkin ele 10 joitus käsin editoidussa versiossa voidaan sitten tallentaa erilliseen < teeseen, kuten tiedostoon.
Kokeet IMS käsittää edullisesti kokeiden projektinhallinnan. Projei yhden tai useamman kokeen, kuten näytteenoton, käsittelyn, ohjau 15 turbation), ruokkimisen, viljelyn, manipuloinnin, puhdistamisen, kio< tai muunlaisen yhdistämisen, erottamisen, mittauksen, luokittamk mentoinnin tai in-silico -työvirran.
Kokeiden projektinhallinnan etuna on, että kaikki mittausl kontrolloidut olosuhteet tai ohjaukset ("mitä"), biomateriaalit ja pa 20 (Mmissän), sekä relevanttien kokeiden ajoitus ("koska”) ja menetelmäl :voidaan rekisteröidä koedatan tulkitsemista varten. Toinen etu tulee : suudesta hyödyntää muuttujankuvauskieltä koedatan tallentamisei ,·*·] aiemmin selostettiin.
• * a”‘. Kuvio 9 esittää koe-oliota IMS:n koeosiossa. Kukin IMS:« .! .* 25 nettu projekti 902 käsittää yhden tai useamman kokeen 904. Kullaki 14« 904 on relaatiot lartteistodataan 906, käyttäjädataan 908 ja metodid, :·*·* Kukin metodiolio 910 liittyy koeottoon 914 ja koeantoon 920. Koeotl kee relevantin oton, kuten biomateriaalin 916 (esimerkiksi populaatio reagentin tai näytteen) tai dataolion 918 (esimerkiksi kontrolloidut c 20 dataolioiden muodossa (kuten kuvioissa 6A ja 6B näytetyt datajou kumentit tai taulukkolaskentatiedostot). Koeanto 920 voi käsittää r tyyppiluokittelun ja/tai genotyyppiluokittelun dataolioissa.
Kokeella on myös kohde 930, joka on tyypillisesti biomal 5 (esimerkiksi populaatio, yksilö, reagentti tai näyte), mutta in-silico kohde voi olla dataolio 934.
Menetelmäoliolfa 910 on relaatio menetelmäkuvaukseen kuvaa menetelmän. Menetelmäkuvauksen 912 vieressä oleva silmul taa, että yksi menetelmäkuvaus voi viitata toisiin menetelmäkuvauks 10 Kokeen otto 914 ja kokeen anto 920 ovat joko spesifisiä aaleja 916, 922 tai dataolioita 918, 924, jotka ovat samoja data« kuin vastaavat elementit kuviossa 2. Jos koe on märkälaboratoriok antobiomateriaalit 916, 922 ovat kuvion 2 biomateriaalin 210 kaksi eri) instanssia. Ne voivat esimerkiksi olla kaksi spesifistä näytettä 21 15 Koska biokemiallinen informaatio (viitenumero 200 kuvi projektin informaatio kuvataan yhteisillä dataolioilla, projektihan seuraamaan kunkin informaatioelementin historiaa. Se pystyy my roimaan tuottavuutta lisättynä informaatiomääränä resurssia (kute vuotta) kohti.
20 Koeprojektinhallitsija käsittää edullisesti projektieditorir käyttöliittymä, joka tukee projektinhallinnan toiminnallisuutta proje : teettejä varten. Tämä antaa lisäksi kaikki ne normaalin projektinhalli jotka ovat hyödyksi myös jäijestelmäbiologian projekteissa.
.***. Projektieditorin edullinen toteutus pystyy seuraamaan k 25 materiaaleja, niiden näytteitä ja kaikkea dataa eri kokeiden kautta, •v. kien märkälaboratorio-operaatiot ja in-silico -datankäsittelyn.
Koeprojekti voidaan esittää verkkona, joka koostuu koeai *··“' ta, kohdebiomateriaaleista ja otto- tai antotuotoksista, jotka ovat bior ja tai dataolioita.
30 Monimutkaisuuden suhteen kuvio 9 on pahimman tapai » » · ft ft t il I ....... t . ......_____......
21 11 Näytteenoton tapauksessa otto-osa osoittaa biomateria näytteenotto kohdistuu, ja anto-osa osoittaa spesifisen näytteen manipuloinnin tapauksessa otto-osa osoittaa manipuloitavan näytte osa osoittaa manipuloidun näytteen. Kombinaatiokokeessa otto-o 5 useita kombinoitavia näytteitä ja anto-osa osoittaa kombinoidun, i< näytteen. Kääntäen, separaatiokokeessa otto-osa osoittaa separoii teen ja anto-osa osoittaa useita separoituja, identifioituja näytteitä, keessa otto-osa osoittaa mitattavan näytteen, ja anto-osa on datao sältää mittaustulokset. Luokituskokeessa otto-osa osoittaa luokitet 10 teen, ja anto-osa osoittaa fenotyypin ja/tai genotyypin. Viljelykokee: anto-osat osoittavat spesifisiä populaatioita, ja laiteosa voi käsittää oiden tunnisteet.
Monimutkaisten kokeiden kuvaamiseksi voi olla koesidoi ers, ei näytetty erikseen), jotka yhdistävät useita kokeita tavalla, jok 15 kin määrin analoginen tapaan, jolla polkuyhteydet 700, 720, 730 yh polkuja.
Biomateriaalikuvaukset
Kuvio 10 näyttää esimerkin IMS:n biomateriaaliosion ot sesta toteutuksesta. Tulee huomata, että tämä on vain yksi esimerkl 20 biomateriaalit voidaan kuvata riittävästi ilman kaikkia kuviossa 1C
• »*; elementtejä. Biomateriaaliosio 210 alaelementteineen 210-1 ... 21(
IM
s\: kaosio 214 alaelementteineen 214-1 ... 214-5 on lyhyesti selostetl ,**\ yhteydessä. Kuvio 10 näyttää, että biomateriaalilla 210 voi olla m< • * e“*; neen -relaatio tilaelementtiin 1002, fenotyyppielementtiin 1004 ja t . 25 menttiin 1006. Valinnaista organismisidontaa 1008 voidaan käytti mään (sekoittamaan) eri organismeja. Esimerkiksi organismisidont ***** osoittaa, että tietty populaatio käsittää x prosenttia organismia 1 ja) organismia 2.
Organismielementin 214-1 alapuolinen silmukka 1010 tai
Mi 22 V[concentration]P[P53]U[mol/l]ld[Patient X]L[human cytDplasm]=0.01.
Eräs tällaisen paikkatiedon etu on parannettu ja system; pa verrata paikkoja näytteissä ja teoreettisissa rakenteissa, kute jotka joudutaan varmentamaan relevanteilla mittaustuloksilla.
5 Toinen etu, joka saavutetaan tallentamalla biomateriaa naisesti kuviossa 10 näytetyllä tavalla, liittyy datan visualisointiin. I biomateriaalit voidaan korvata niiden fenotyypeillä. Eräs esimerkki korvaamisesta on, että tietyt yksilöt luokitellaan "allergisiksi”, mikä paljon havainnollisempi kuin pelkkä tunniste.
10 Datan seurattavuus
Kuviot 11A ja 11B osoittavat datan seurattavuutta kahdet valossa. Kuvio 11A esittää näytteenottotapahtumaa. Kaikki näyttei tietystä yksilöstä A, jota osoitetaan viitenumerolla 1102. Viitenui osoittaa yleisesti neljää nuolta, joista kukin osoittaa näytteenottoa 15 kellä. Esimerkiksi hetkellä 5 saadaan näyte 4, kuten viitenumero 11( Kuvioiden 3A - 4 yhteydessä käytettyä muuttujankuvauskieltä käytti hetkellä 5 voidaan ilmaista lausekkeella Sa[4]T[5j. Lauseke S ld[A]T[5] tarkoittaa, että näyte 4 saatiin yksilöstä A hetkellä 5.
Hetkellä 12 näytteestä 4 otetaan kaksi muuta näytettä. I 20 1100 osoittaa, näyte 25 otetaan näytteestä 4 erottamalla tumat. \ 1112 osoittaa näytteen 25 havaintoa (mittausta), nimittäin proteiinii sensaatiota, jonka tässä esimerkissä näytetään olevan 4,95.
:"': Kuvio 11B esittää datan seurattavuutta tapahtumaketjuss teutetaan ohjaus annostelemalla yksilölle B 1150 tiettyä yhdistettä. I 25 numerot 1152-1158 osoittavat, 10 gramman annos yhdistettä aba ]···. näytteelle 40 hetkellä 1, ja tuo näyte annetaan yksilölle B hetkellä
**' mero 1160 osoittaa mannoosin annostelua yksilölle B hetkellä 5. I
. alapuoli on analoginen kuvion 11A kanssa, ja erillinen selostus jää p • · · Näyttämällä sellaisia kuvia, joita sisältyy kuvioihin 11A ja 23 kaisten tapausten tukemiseksi visualisointilogiikan edellä tulisi oli aktivoimia suotimia, jotka sallivat käyttäjien nähdä vain mielenkiinn< Jos esimerkiksi käyttäjä on kiinnostunut vain kuviossa 11A näyte teestä 25, niin voidaan näyttää vain tapahtumien (näytteiden) k< 5 1106-1110-1112.
Työvirtojen kuvaukset
Kuvio 12A näyttää ohjelmisto-komponenttimallia työvirti flow) kuvaamiseksi ja hallitsemiseksi IMS:ssä. Työvirta 1202 voi sis työvirtoja. Alimman tason työvirta sisältää työkalun 1208. Kullakin ty 10 omistaja-käyttäjä 1220. Kukin työvirta kuuluu johonkin projektiin 12' teja tarkasteltiin kuvion 9 yhteydessä.)
Työkalut määrittetytermejä ovat työkalun nimi, kategor lähde, aluke (pre-tag), suoritusosa (executable), otot, annot ja pal\ luokka (mikäli ei oletusarvo). Tämä informaatio talletetaan työkaluti 15 1208.
Ottomäärityksiin sisältyy aluke, tunnistenumero, kuvaui tyyppi, lopuke (post-tag), komentorivijäijestys, valinnaisuus-status vai valinnainen). Tämä informaatio talletetaan työkalun ottosidon binder) 1210 tai työkalun antosidontaan (output binder) 1212.
20 Dataoliotyypit määritellään järjestelmään termeillä da . nimi, kuvaus, datakategoria (esim. tiedosto, hakemisto alihakemi .*!*: tiedostoineen, datajoukko, tietokanta, jne.) On useita dataoliotyyp kuuluvat samaan kategoriaan mutta joilla on erilainen syntaksi tai s ja jotka sen vuoksi kuuluvat eri dataoliotyyppiin olemassa olevien ,* / 25 yhteensopivuussääntöjen vuoksi. Tämä informaatio talletetaan data • * ·* ; 1214. Työkatupalvefimen sidonta 1224 osoittaa sen palvelimen 1 työkalu voidaan suorittaa.
Tyypitettyjä dataolioita käytetään ohjaamaan erilaisten yhteensopivuutta, jotka voivat olla tai olla olematta yhteensopivia. 1 ·<« I i Ifl« i a <iä« .. « ...li<aa. 4 ........
24
Kuvio 12B esittää asiakas-palvelin -arkkitehtuuria, jot asiakaspäätelaitteessa CT suoritettava graafinen työvirtojen ed Graafinen työvirtojen editori 1230 kytkeytyy työvirtapalvelimen 1; suoritushalfitsijan (executor) palveluobjektiin työkalupalvelimessa 1 5 fista työvirtojen editoria 1230 käytetään valmistelemaan, suorittama; toroimaan sekä tarkastelemaan työvirtoja ja dataolioita, jotka viestiv tietokannan 1236 kanssa. Työvirtapalvelin 1232 huolehtii työvirtoje misesta käyttämällä yhtä tai useampaa työkalupalvelinta 1234. Rele kalupalvelimen osoite voidaan löytää palvelintaulukosta (kuvio 12A). 10 Kukin työkalupalvelin 1234 käsittää suoritushallitsijan ja jektin, joka pystyy kutsumaan mitä tahansa itsenäistä työkalua, jok nettu työkalupalvelimelle. Suoritushallitsija hallitsee työvirran kaikkie tien työkalujen suorittamista relevanteilla dataolioilla standardoidun jektin kautta. Palveluobjekti tarjoaa suoritushallitsijalle yhteisen 15 minkä tahansa itsenäisen ohjelmistotyökalun suorittamiseksi. Työka informaatiota voidaan kuvata XML-tiedostossa, jota käytetään alusti tadataa kullekin työkalulle työkalutietokannassa (kuvion 12A kohta veluobjekti vastaanottaa anto- ja ottodatan, ja käyttämällä työkalun formaatiota, se voi valmistella vaaditun komentorivin työkalun suoritt 20 Kuvioissa 12A ja 12B näytetty työvirtojen/työkalujen hallit: helposti perinteisiä työkaluja ja kolmansien osapuolten työkaluja ' : jenrtyökalujen hallitsijan muihin etuihin kuuluu työvirtojen täydellinen tointi, helppo uudelleenkäytettävyys ja automaattinen suoritus. Esim virtojen/työkalujen hallitsija voi piilottaa kolmansien osapuolten työ* .!!!: 25 mistajakohtaiset käyttöliittymät ja korvata ne IMS:n yhteisellä graafis . v, liittymällä. Käyttäjät voivat siis käyttää yhteisen graafisen käyttöliittyn toja valmistelemaan, suorittamaan ja monitoroimaan sekä tarkastele ’··** virtoja ja niiden dataolioita.
Kuvio 12C näyttää, kuinka työvirtaeditori voi esittää työvin 30 jen ja dataoiioiden verkkona siten, että dataoliot ovat työkalujen ott< 25 määritellään alkeiskomponenttien kautta, joita voidaan lisätä kun saadaan. Tämän ominaisuuden eräs etu on, että IMS voidaan varus to- ja ohjelmistovälineillä polkujen automaattista täyttämistä varte (usein kaupallisista) sekvenssitietokannoista. Tähän tarvitaan yht 5 ulkoisiin tietokantoihin, jäsennyslogiikka kutakin tiettyä tietokantaa i logiikka polun komponenttien (tai ainakin joidenkin) johtamiseksi ui tokantojen ominaisuustaulukoista (feature table) tai muusta info Huomattakoon, että sekvenssitietokannat eivät tuota mitään eksp fomnaatiota polkumalleista. Ne tuottavat vain informaatiota geeneis 10 koodaamista proteiineista. Mutta sopiva logiikka voi päätellä ainakii kukomponentit tästä informaatiosta. Logiikka voi tulkita joidenkin st tokantojen tuottamat annotaatiot valtavaksi relaatiomassaksi hyvin jen biokemiallisten olioiden avulla (spesifinen geeni ja spesifinen jo iineja) heti, kun nämä relaatiot - joista sekvenssitietokannat eivät k 15 siittisesti mitään - on talletettu polkutietokantaan (kuviot 7A ja 7B). I (transkriptioita ja translaatioita), joista sekvenssitietokannat eivät kerro mitään, ei voida täydellisesti kuvata biologista perustietämystä lä, mutta hyvin määriteltyjen biokemiallisten olioiden ja biologisten teiden avulla interaktioiden väliset yhteydet voidaan kuvata täydeltä 20 mallissa. Ei edes ole välttämätöntä, että sekvenssitietokanta sisältä tiota transkripteista. Sen sijaan keksinnöllinen logiikka voi määrittää : identifioida ja nimetä ne. Nimeäminen on usein välttämätöntä, koi molekyylejä ei usein nimetä niin kuin geenejä tai proteiineja.
* * IMS, jossa on yllä selostettu polkumalli, perustuu siis yl ,!!!: 25 interaktioihin, ja IMS tukee epätäydellisiä polkumalleja. On hyödyl määrittää yhteydet automaattisesti ulkoisista tietokannoista, vaikka i pitääkin täydentää jälkikäteen, kun lisätietoa on saatavana.
*··’* Kuvio 13 esittää prosessia, kuten ohjelmistorutiinia, poll maattista täyttämistä varten sekvenssitietokannasta. Tässä esime 30 venssitietokannassa on kaksi identifioitua geeniä G1 ja G2, joita ··· 26
Esimerkiksi EMBL-tietokannassa on seuraavanlaisia omii lukolta:
Rivi Avain Paikka/Määrite FT CDS 22..2892
5 FT
FT db_xref=HSWISS-PROT:P49746"
FT
FT /gene="THB$3"
FT
10
On FT-rivejä (feature table, ominaisuustaulukko), joissa < na CDS (coding sequence, koodaussekvenssi), joka osoittaa koot ja spesifisiä määritteitä, jota tuottavat erilaisia tietokantaviittauksic (/gene=THBS3") ja niiden proteiineihin (db_xref="SWISS-PR01 15 Tämä tarkoittaa, että geenillä, jonka identifioi THBS3, on proteiinit identifioi MSWISS-PROT:P49746", ja geenin ja proteiinin välissä mRNA. Nimet on muunnettava suositelluiksi nimiksi (ks. nimitauluk< ossa 2).
Oletetaan, että annotoituna ominaisuutena on geeni G 20 viitenumerolla 1302) silmukointivarianttituotteiden (splice variant p P2 ja P3 kanssa (viitenumerot 1342,1344 ja 1346). Silloin tiedämrr tyy olla kolme silmukointivariantti mRNA:ta, nimittäin Tr1=mRI P1:een, Tr2=mRNA G1:stä P2:een, ja Tr3=mRNA G1:stä P3:een mukointivariantti mRNA:t osoitetaan viitenumeroilla 1322,1324 ja 1: ·:··: 25 Oletetaan lisäksi, että annotoituna ominaisuutena on 1308, jolla on yksi tuote P4, 1348. Silloin tiedämme, että täyty mRNA, nimittäin Tr4=mRNA, 1328, G2:sta P4:ään.
Yllä olevan informaation perusteella polun luuranko, kute a a.a 13 näytetty, voidaan luoda automaattisesti.
30 Aluksi transkriptio-interaktiot voidaan täydentää m 11 27
Automaattisen populointiominaisuuden etu on automaat min kattava poiunmuodostus kullekin organismille, mikä helpc tyneempää polun kokoamista, joka perustuu kuviossa 13 näytettyyr vioon.
5 Laitteiston ja ohjelmiston osalta IMS tarvitsee pääsyn ull· kantoihin. Moniin tietokantoihin voidaan päästä tavallisella Internet Niinpä automaattisen populointiohjelmiston tulee emuloida Internet· muuten tuottaa yhteensopivia komentoja. Lisäksi IMS tarvitsee jä; giikan (parsing) ja tietoa siitä, kuinka kunkin tietokannan anto on järj 10 Spatiaaliset referenssimallit
Kuvio 14 esittää spatiaalisia referenssimalleja erilaisille le. Aiemmin todettiin, että yksinkertaiset suorakulmaiset tai napak järjestelmät voivat riittää joillekin solutyypeille. Koordinaattijäijestelr lista normalisoida siten, että maksimietäisyys referenssipisteestä on 15 On monia solutyyppejä, joille yksinkertainen suorakulma pakoordinaattijäijestetmä ei riitä. Esimerkiksi kantasolut ovat suui mikä tarkoittaa, että niillä on etupää ja takapää. Hermosolut ovat v nimutkaisempia. Niinpä IMS edullisesti käsittää useita spatiaalisia malleja, ja spatiaalinen piste ilmaistaan referenssimallin ja sen sis 20 alueen yhdistelmänä.
: f: Kuvio 14 esittää kolmea erilaista referenssimalli-esimer • i renssimalli 1400 on yksinkertainen koordinaattijärjestelmä, kuten t .*'·! nen suorakulmainen koordinaattijäriestelmä. Joillekin solutyypeille * * “m\· yksi tai kaksi koordinaattia. Jos kyseinen solutyyppi on pyörähdyssy 25 napakoordinaattijäijestelmä voi olla parempi kuin suorakulmainen.
.;' Referenssimalli 1410 perustuu solun jakamiseen useaan • *
Alueiden määrä tulisi valita siten, että biokemiallinen informaatio alueella. Referenssimalli 1410 soveltuu kompaktille suuntautune( kuten kantasolulle. Malli 1410 on suuntautunut, mutta pyörähdyssy i«« Ä(..
28 te, joka on aksonin ulkopinnalla sen pituussuuntaisessa keskipist daan ilmaista muodossa {1420, 1425, (0,5,1)}, missä 1420 osoitta simallia, 1425 osoittaa aluetta referenssimallin sisällä, 0,5 on nom tuussuuntainen koordinaatti aksonia pitkin ja 1 tarkoittaa 100°> 5 aksonin poikkileikkausta pitkin.
Alan ammattilaiselle on selvää, että tekniikan kehittyessä mukainen konsepti voidaan toteuttaa eri tavoin. Keksintö suoritusr ei rajoitu yllä esitettyihin esimerkkeihin vaan ne voivat vaihdella p« musten suoja piirin puitteissa.
4 « 4 4 B · 1 414 f e • · 4 e1 • 1 • tv 4 4 • 1 • • 4 ·· 4 * m · * 4 * · * 1 t 4 4 • m 4 * 1 4 · 1 4 4
Claims (12)
- 29
- 1. Informaationhallintajärjestelmä biologisen informaation litsemiseksi, johon infomriaationhallintajärjestelmään kuuluu palvelit tokanta (DB) sekä välineet (220) vastaanottamaan geneettistä inl 5 yhdestä tai useammasta geenisekvenssitietokannasta, missä maini tinen informaatio käsittää geenejä (1302, 1308) ja geenien tuotte 1348); tunnettu siitä, että informaationhallintajäijestelmään giikka (1300) luomaan automaattisesti mainitusta geneettisestä infc 10 biologisia polkuja (1302 - 1348), joihin kuuluu geenien ja geenien välisiä välivaiheita (1312 -1338).
- 2. Patenttivaatimuksen 1 mukainen informaationhallintaj tunnettu siitä, että siihen kuuluu biologisten polkujen (700) st kuvauksia, jotka muodostuvat ainakin poluista (212), biokemiallisi 15 (218), yhteyksistä (216) ja vuorovaikutuksista (222) siten, että: • kukin polku (212) liittyy yhteen tai useampaan yhteyteen - kukin yhteys (216) liittää yhden biokemiallisen olion (211 vuorovaikutuksen (222); ja - kukin polku (212) liittyy spesifiseen sijaintiin (214).
- 3. Patenttivaatimuksen 2 mukainen informaationhallintaj V\ tunnettu siitä, että siihen kuuluu välineet automaattisesti muo • · · polkujen tarjoamiseksi käyttäjän täydennettäväksi. s * • * ·»· ·:·** 4. Patenttivaatimuksen 2 tai 3 mukainen infbrmaationha :v. telmä, tunnettu siitä, että kukin vuorovaikutus (222) liittyy yhte !···. 25 ampaan kineettiseen lakiin.
- 5. Jonkin patenttivaatimuksen 2-4 mukainen informaat * järjestelmä, tunnettu siitä, että siihen kuuluu välineet yhden tai i 30 toimen assosioimiseksi kuhunkin yhteyteen, missä stökiömetrin osoittaa biokemiallisen olion (218) tuotettujen tai kulutettujen molekj rän vuorovaikutuksessa (222).
- 7. Jonkin patenttivaatimuksen 1 - 6 mukainen informaat 5 järjestelmä, tunnettu siitä, että siihen kuuluu käyttöliittymälogiikl jen biologisten polkujen (700) strukturoitujen kuvausten visualisoi esittämiseksi.
- 8. Patenttivaatimuksen 7 mukainen informaationhallintaj tunnettu siitä, että käyttöliittymälogiikka käsittää välineet näyttä 10 alisointeja (800) mitatuista tai perturboiduista muuttujista, jotka on p biologisten polkujen (700) biokemiallisiin olioihin (881), vuorovaikuti ja/tai yhteyksiin (883).
- 9. Jonkin patenttivaatimuksen 1 - 8 mukainen informaal järjestelmä, tunnettu siitä, että kuuluu polkuyhteyksiä (720, 1 15 polun (711-713) yhdistämiseksi kompleksisiksi poluiksi.
- 10. Jonkin patenttivaatimuksen 1 - 9 mukainen informaal järjestelmä, tunnettu siitä, että biologinen informaatio (200) kä; joukkoja (202,610,620), joista kukin datajoukko käsittää: . - muuttuja-arvomatriisin (614, 624), joka sisältää riveiks 20 keiksi järjestettyjä muuttuja-arvoja; l.S - muuttujan kuvauskielellä (30) olevan rivienkuvauslistan ***\ muuttuja-arvomatriisin riveistä; / - muuttujankuvauskielellä (30) olevan sarakkeidenkuvaus : V 622) muuttuja-arvomatriisin sarakkeista; ··· 25. muuttujankuvauskielellä (30) olevan kiinteiden dimensic uksen (611, 621) yhdestä tai useammasta kiinteästä dimensiosta, : yhteisiä muuttuja-arvomatriisin kaikille arvoille. m · · 31
- 12. Patenttivaatimuksen 11 mukainen informaationhallir mä, t u n n e 11 u siitä, että siihen kuuluu logiikka (300) syntaksit tekemiseksi mainitulla muuttujankuvauskielellä ilmaistuille muuttujille
- 13. Patenttivaatimuksen 11 tai 12 mukainen infomnaatior 5 jestelmä, tunnettu siitä, että se käsittää yhdistettyjä muuttuja!; joista kukin käsittää kaksi tai useampia muuttujalausekkeita, jotka operaattoreilla ja/tai funktioilla.
- 14. Jonkin edellisen patenttivaatimuksen mukainen inforr lintajärjestelmä, tunnettu siitä, että siihen kuuluu käyttöliittymä! 1. tajälkien (1102-1174) näyttämiseksi toisiinsa liittyvien datajoukkojei » 9 9 * 9 9 9 999 9 9 9 9 9 9 99 9 9 9 99 9 9 9 9 999 9 9 9 99 9 9 9 9 9 9 9 9 999 9 9 9 9 999 9 9 9 9 9 9 99 9 999 32
Priority Applications (8)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FI20031026A FI117068B (fi) | 2003-07-04 | 2003-07-04 | Informaationhallintajärjestelmä biokemiallista informaatiota varten |
CA002531131A CA2531131A1 (en) | 2003-07-04 | 2004-07-02 | Information management system for biochemical information |
EP04103137A EP1494160A3 (en) | 2003-07-04 | 2004-07-02 | Information management system for biochemical information |
AU2004254729A AU2004254729A1 (en) | 2003-07-04 | 2004-07-02 | Information management system for biochemical information |
PCT/FI2004/000424 WO2005003999A1 (en) | 2003-07-04 | 2004-07-02 | Information management system for biochemical information |
JP2006516238A JP2007520773A (ja) | 2003-07-04 | 2004-07-02 | 生化学情報のための情報管理システム |
US10/883,047 US20050010373A1 (en) | 2003-07-04 | 2004-07-02 | Information management system for biochemical information |
RU2005141111/09A RU2005141111A (ru) | 2003-07-04 | 2004-07-02 | Система управления биохимической информацией |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FI20031026A FI117068B (fi) | 2003-07-04 | 2003-07-04 | Informaationhallintajärjestelmä biokemiallista informaatiota varten |
FI20031026 | 2003-07-04 |
Publications (3)
Publication Number | Publication Date |
---|---|
FI20031026A0 FI20031026A0 (fi) | 2003-07-04 |
FI20031026L FI20031026L (fi) | 2005-01-05 |
FI117068B true FI117068B (fi) | 2006-05-31 |
Family
ID=27636064
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
FI20031026A FI117068B (fi) | 2003-07-04 | 2003-07-04 | Informaationhallintajärjestelmä biokemiallista informaatiota varten |
Country Status (3)
Country | Link |
---|---|
US (1) | US20050010373A1 (fi) |
EP (1) | EP1494160A3 (fi) |
FI (1) | FI117068B (fi) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4093157B2 (ja) * | 2003-09-17 | 2008-06-04 | 株式会社日立製作所 | 分散検査装置及びホスト検査装置 |
US7941433B2 (en) * | 2006-01-20 | 2011-05-10 | Glenbrook Associates, Inc. | System and method for managing context-rich database |
US8332209B2 (en) * | 2007-04-24 | 2012-12-11 | Zinovy D. Grinblat | Method and system for text compression and decompression |
EP2206049A4 (en) | 2007-09-28 | 2013-11-13 | Xcerion Ab | NETWORK OPERATING SYSTEM |
KR101278652B1 (ko) * | 2010-10-28 | 2013-06-25 | 삼성에스디에스 주식회사 | 협업 기반 염기서열 데이터의 관리, 디스플레이 및 업데이트 방법 |
US20150261914A1 (en) * | 2014-03-13 | 2015-09-17 | Genestack Limited | Apparatus and methods for analysing biochemical data |
US10657179B2 (en) | 2017-09-01 | 2020-05-19 | X Development Llc | Bipartite graph structure |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5930154A (en) * | 1995-01-17 | 1999-07-27 | Intertech Ventures, Ltd. | Computer-based system and methods for information storage, modeling and simulation of complex systems organized in discrete compartments in time and space |
US5980096A (en) * | 1995-01-17 | 1999-11-09 | Intertech Ventures, Ltd. | Computer-based system, methods and graphical interface for information storage, modeling and stimulation of complex systems |
WO2000049540A1 (en) * | 1999-02-19 | 2000-08-24 | Cellomics, Inc. | Method and system for dynamic storage retrieval and analysis of experimental data with determined relationships |
WO2001013105A1 (en) * | 1999-07-30 | 2001-02-22 | Agy Therapeutics, Inc. | Techniques for facilitating identification of candidate genes |
US7356416B2 (en) * | 2000-01-25 | 2008-04-08 | Cellomics, Inc. | Method and system for automated inference creation of physico-chemical interaction knowledge from databases of co-occurrence data |
US20020091490A1 (en) * | 2000-09-07 | 2002-07-11 | Russo Frank D. | System and method for representing and manipulating biological data using a biological object model |
WO2002103608A2 (en) * | 2001-06-14 | 2002-12-27 | Ramot University Authority For Applied Research & Industrial Development Ltd. | Method of expanding a biological network |
-
2003
- 2003-07-04 FI FI20031026A patent/FI117068B/fi active IP Right Grant
-
2004
- 2004-07-02 EP EP04103137A patent/EP1494160A3/en not_active Withdrawn
- 2004-07-02 US US10/883,047 patent/US20050010373A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
EP1494160A3 (en) | 2007-10-24 |
US20050010373A1 (en) | 2005-01-13 |
EP1494160A2 (en) | 2005-01-05 |
FI20031026A0 (fi) | 2003-07-04 |
FI20031026L (fi) | 2005-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
FI118102B (fi) | Informaationhallintajärjestelmä työvirtojen hallitsemiseksi | |
Lacroix et al. | Bioinformatics: managing scientific data | |
Cline et al. | Integration of biological networks and gene expression data using Cytoscape | |
Usadel et al. | Extension of the visualization tool MapMan to allow statistical analysis of arrays, display of coresponding genes, and comparison with known responses | |
Goff et al. | The iPlant collaborative: cyberinfrastructure for plant biology | |
Stanley et al. | genepopedit: A simple and flexible tool for manipulating multilocus molecular data in R | |
Revell et al. | Rphylip: an R interface for PHYLIP | |
Dandekar et al. | Software applications toward quantitative metabolic flux analysis and modeling | |
Fontana et al. | Reconciling trait based perspectives along a trait‐integration continuum | |
FI117067B (fi) | Informaationhallintajärjestelmä biokemiallista informaatiota varten | |
FI117068B (fi) | Informaationhallintajärjestelmä biokemiallista informaatiota varten | |
FI118101B (fi) | Informaationhallintajärjestelmä biokemiallista informaatiota varten | |
Vondrackova et al. | LORA, Lipid Over-Representation Analysis based on structural information | |
Bistarelli et al. | On representing biological systems through multiset rewriting | |
Imbert et al. | Development of a knowledge graph framework to ease and empower translational approaches in plant research: a use-case on grain legumes | |
FI117988B (fi) | Informaationhallintajärjestelmä biokemiallista informaatiota varten | |
FI118063B (fi) | Informaationhallintajärjestelmä biokemiallista informaatiota varten | |
Denaro et al. | A pipeline for testing drug mechanism of action and combination therapies: From microarray data to simulations via Linear-In-Flux-Expressions: Testing four-drug combinations for tuberculosis treatment | |
Strand et al. | KERNELPOP, a spatially explicit population genetic simulation engine | |
Ayadi et al. | Logical and semantic modeling of complex biomolecular networks | |
WO2005003999A1 (en) | Information management system for biochemical information | |
Roux-Rouquié et al. | Ten Top Reasons for systems biology to get into Model-Driven Engineering | |
Schoof et al. | The PlaNet consortium: a network of European plant databases connecting plant genome data in an integrated biological knowledge resource | |
Chen et al. | multiomics: A user-friendly multi-omics data harmonisation R pipeline [version 1; peer review: 2 not approved] | |
Vieira | Integrative pathway analysis approaches for cancer research and drug development |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FG | Patent granted |
Ref document number: 117068 Country of ref document: FI |