Zusammenfassung
Die Wiederverwendung von Simulationsmodellen biologischer Systeme ist mit der ansteigenden Zahl der in Modelldatenbanken gespeicherten Modelle zu einem wichtigen Forschungsproblem geworden. Ein Teilproblem ist die effiziente Suche nach relevanten Modellen in einer Datenbasis. Als Lösungsansatz wurde kürzlich die Nutzung von Information-Retrieval-Techniken für das bewertete Finden von Modellen vorgestellt.
Die im Folgenden beschriebene Software stellt Anwendungsentwicklern ein Framework zur Evaluation verschiedener Retrieval- und Rankingfunktionen unter Nutzung unterschiedlicher Datenbasen zur Verfügung. Der modulare Aufbau des Frameworks ermöglicht die Unterstützung weiterer XML-basierter Beschreibungsformate sowie das Einbinden zusätzlicher Funktionen. Voraussetzungen für die Verwendung des Frameworks sind die Kodierung der Simulationsmodelle in einem XML-basierten Standard-Repräsentationsformat sowie die Verfügbarkeit von semantischen Modellinformationen, z.B. in Form von in Ontologien kodierten Meta-Informationen. Sombi wurde als Evaluationswerkzeug für Datenbankentwickler im Bereich der Modellspeicherung in der Systembiologie entwickelt. Eine Verwendung des Frameworks auf anderen Anwendungsgebieten ist jedoch vorstellbar.
Notes
Information vom 05.01.2011.
hier verkürzt dargestellt.
Wir verweisen dazu auf unsere Arbeiten an einer SBML annotation Erweiterung [21].
Literatur
Ashburner M, Ball CA, Blake JA, Botstein D, Butler H et al. (2000) Gene ontology: tool for the unification of biology the gene ontology consortium. Nat Genetics 25(1):25–29. doi:10.1038/75556
Bornstein BJ, Keating SM, Jouraku A, Hucka M (2008) LibSBML: an API library for SBML. Bioinformatics 24(6):880–881. doi:10.1093/bioinformatics/btn051
Cuellar AA, Lloyd CM, Nielsen PF, Bullivant DP, Nickerson DP, Hunter PJ (2003) An overview of CellML 1.1, a biological model description language. Simulation 79(12):740–747. doi:10.1177/0037549703040939
Degtyarenko K, de Matos P, Ennis M, Hastings J, Zbinden M et al. (2008) ChEBI: a database and ontology for chemical entities of biological interest. Nucleic Acids Res 36(Suppl 1):D344–D350. doi:10.1093/nar/gkm791
Gospodnetic O, Hatcher E (2005) Lucene in action: a guide to the Java search engine. Manning, Greenwich
Hälke R (2009) Annotation extraction from computational biology models. Study thesis, Rostock University
Henkel R, Endler L, Peters A, Le Novère N, Waltemath D (2010) Ranked retrieval of computational biology models. BMC Bioinform 11(1):423+. doi:10.1186/1471-2105-11-423
Hucka M, Bergmann F, Hoops S, Keating S, Sahle S et al. (2010) The systems biology markup language (SBML): language specification for level 3 version 1 core (release 1 candidate). Nat Prec. doi:10.1038/npre.2010.4123.1
Joachims T, Granka L, Pan B, Hembrooke H, Radlinski F, Gay G (2007) Evaluating the accuracy of implicit feedback from clicks and query reformulations in web search. ACM Trans Inf Syst 25(2):7
Köhn D (2009) Enhancing model Reuse in systems biology using an integrative storage and retrieval system. In: Proceedings of the 2009 joint EDBT/ICDT Ph.D. workshop. ACM, New York
Köhn D, Maus C, Henkel R, Kolbe M (2009) Towards enhanced retrieval of biological models through annotation-based ranking. In: Paton NW, Missier P, Hedeler C (Hrsg) Data integration in the life sciences, 6th international workshop, DILS. Lecture notes in bioinformatics, Bd 5647. Springer, Manchester, S 204–219
Lange M, Spies K, Bargsten J, Haberhauer G, Klapperstück M et al. (2010) The LAILAPS search engine: relevance ranking in life science databases. J Integr Bioinform 7(2):110
Le Novère N (2006) Model storage, exchange and integration. BMC Neurosci 7(Suppl 1):S11. doi:10.1186/1471-2202-7-S1-S11
Le Novère N, Finney A, Hucka M, Bhalla US, Campagne F et al. (2005) Minimum information requested in the annotation of biochemical models (MIRIAM). Nat Biotechnol 23(12):1509–1515. doi:10.1038/nbt1156
Li C, Donizelli M, Rodriguez N, Dharuri H, Endler L et al. (2010) Biomodels database: an enhanced, curated and annotated resource for published quantitative kinetic models. BMC Syst Biol 4(1):92. doi:10.1186/1752-0509-4-92
Mcwilliam H, Valentin F, Goujon M, Li W, Narayanasamy M et al. (2009) Web services at the European Bioinformatics Institute, 2009. Nucleic Acids Res 37(Web server issue):W6–W11
Romiti M, Cooper P (2005) Entrez Help. http://www.ncbi.nlm.nih.gov/books/NBK3837/
Strömbäck L, Hall D, Lambrix P (2007) A review of standards for data exchange within systems biology. Proteomics 7(6):857–867. doi:10.1002/pmic.200600438
Uhrmacher AM, Degenring D, Lemcke J, Krahmer M (2005) Towards reusing model components in systems biology. In: Computational methods in systems biology, Bd 3082. Springer, Berlin/Heidelberg, S 192–206
Uhrmacher AM, John M, Mazemondet O, Unger A, Rharass T et al (2009) Computer science meets cell biology—GRK dIEM oSiRiS (Tech. rep.). Rostock University, Rostocker Informatikberichte
Waltemath D, Swainston N, Lister A, Bergmann F, Henkel R, Hoops S, Hucka M, Juty N, Keating S, Knüpfer C, Krause F, Laibe C, Liebermeister W, Lloyd C, Misirli G, Schulz M, Taschuk M, Le Novère N (2011) SBML level 3 package proposal: annotation. Nat Prec. doi:10.1038/npre.2011.5610.1
Wimalaratne SM, Halstead MDB, Lloyd CM, Cooling MT, Crampin EJ, Nielsen PF (2009) Facilitating modularity and reuse: guidelines for structuring CellML 1.1 models by isolating common biophysical concepts. Exp Physiol 94(5):472–485. doi:10.1113/expphysiol.2008.045161
ZaißK (2008) Ontologie-Matching: Überblick und Evaluation. Datenbank Spektrum 24:17–24
Danksagung
Wir danken Josephine Freyman, Hannes Grunert, Daniel Lehmann, Hans-Christian Rieger, Muhammad Bin Abdus Salam, Andreas Schult, Norman Soetbeer, Jan Stöwesand, Martin Winkler und Tobias Wunderlich für die Unterstützung bei der Implementierung des Frameworks. Weiterhin danken wir Robert Hälke für die Entwicklung des tinyParser und Martin Weitzel für die Konzeption des Frontends.
Author information
Authors and Affiliations
Corresponding author
Additional information
Die Arbeit wurde teilweise gefördert durch die Deutsche Forschungsgemeinschaft (DFG), GRK dIEM oSiRiS 1387/1.
Rights and permissions
About this article
Cite this article
Waltemath, D., Henkel, R., Meyer, H. et al. Das Sombi-Framework zum Ermitteln geeigneter Suchfunktionen für biologische Modelldatenbasen. Datenbank Spektrum 11, 27–36 (2011). https://doi.org/10.1007/s13222-011-0050-x
Received:
Accepted:
Published:
Issue Date:
DOI: https://doi.org/10.1007/s13222-011-0050-x