Anexo:Tesauros versus ontologías
Los tesauros frente a las ontologías es un tema que viene generando bastante literatura en los últimos años para analizar en qué medida son herramientas diferentes, semejantes o complementarias. Algunos de dichos trabajos son Guzmán Luna, Torres Pardo y López García (2006); Kim y Beck (2006); Tsujii y Ananiadou (2005); Kircz, Goris, Drenthe (2005); Hyvonen (2005); García Jiménez (2004); Gilchrist (2004); Ungvary (2004); Moreira, Alvarenga y de Paiva Oliveira (2004) o Eriksen (2003).
La ontología (informática) es una herramienta para la organización, explotación y reutilización de información. Según Gil Leiva (2008, p. 224) desde la década de 2000 se están probando su utilidad en distintos procesos como la recuperación de información (Castells, Fernández y Vallet, 2007; Song et al. 2007), la clasificación de documentos (Yun, Guiyi y Jun, 2006; Weng, 2006) o para la extracción de información (Endres-Niggmeyer et al., 2006; Cimiano, Reyle y Saric, 2005).
Analogías y diferencias entre los tesauros y las ontologías (informática)
editarTESAUROS | ONTOLOGÍAS | |
---|---|---|
Origen | En la década de 1950. Sus antecedentes son las Listas de Encabezamientos de Materia elaboradas a finales del siglo XIX y principios del XX, fundamentadas a su vez en las Rules for a printed dictionary catalogue de Charles Ammi Cutter publicadas en 1876. | En la década de 1980 en el campo de la Inteligencia artificial. Sus antecedentes están en la Filosofía, y concretamente, en aquella parte que estudia la esencia de todo aquello que existe y trata de establecer categorías a partir de sus propiedades trascendentales. |
Finalidad | Indizar documentos y recuperar información | Modelar el conocimiento del mundo, compartir conocimiento consensuado y obtener inferencias |
Usuarios | Profesionales de la Información y Documentación y buscadores de información | Diseñadores y desarrolladores de herramientas para la representación del conocimiento (Sistemas expertos, Web semántica) |
Soporte | Papel y digital | Digital |
Definiciones | Aunque incluye definiciones, contiene principalmente Notas de uso, esto es, el uso concreto que se hace de un término en la indización de documentos y en la recuperación de información en un sistema de información determinado con el fin de eliminar ambigüedades y alcanzar la máxima coherencia posible. | Contiene definiciones universales y consensuadas de cada uno de los conceptos incluidos en la ontología. |
Sinónimos | Sí | Sí |
Inferencias | No | Sí |
Axiomas | No | Sí |
Lenguaje | Lenguaje natural y lenguaje controlado | Lenguaje natural y lenguaje formal |
Reutilización | Toda o parte de la terminología de un tesauro se puede integrar en otro más específico (Ej. un tesauro sobre Patrimonio Histórico en otro de Arqueología); o en otro más general (Ej. un tesauro de Urbanismo en otro de Administración Pública). Coste elevado | Las supra ontologías (especificaciones formales del universo) se pueden reutilizar en las ontologías de ámbito (especificaciones formales de un ámbito concreto). Así por ejemplo, una ontología sobre Medicina puede utilizar parte de una ontología lingüística como WordNet; o bien, parte de una ontología de Economía en otra de Comercio electrónico. Coste medio |
Editores de construcción | Multites, Stride, TCS, Lexico, TermTree2000 | Protégé, Ontolingua server, Swoop, OntoEdit |
Lenguajes de construcción | Lenguajes de marcado : Skos-Core ; Zthes | Lenguajes tradicionales : KIF, Ontolingua, OCML
Lenguajes de marcado: OIL ; DAML + OIL ; RDF ; OWL |
Véase también
editarReferencias
editarCASTELLS, P., FERNÁNDEZ, M. y VALLET, D. An Adaptation of the Vector-Space Model for Ontology-Based Information Retrieval. IEEE Transactions on Knowledge & Data Engineering, 2007, vol. 19, n.º 2, p. 261-272.
CIMIANO, P., REYLE, U. y SARIC, J. Ontology-driven discourse análisis for information extraction. Data & Knowledge Engineering, 2005, vol. 55, n.º 1, p. 59-83.
ENDRES-NIGGMEYER, B. et al. Wissen gewinnen durch Wissen: Ontologiebasierte Informationsextraktion (The use of ontologies for information extraction). nfd Information: Wissenschaft und Praxis, 2006, vol. 57, n.º. 6-7, p. 301-308.
ERIKSEN, L. Fra manuelle thesauri og emneordslister til web-baserte ontologier ogemnekart: metoder og utvikling (From manual thesauri and keyword lists to web-based ontologies and topic maps: methods and development). DF Revy, 2003, vol. 26, n.º 6, p.168-171.
GARCÍA JIMÉNEZ, A. Instrumentos de representación del conocimiento: tesauros versus ontologías. Anales de Documentación, 2004, n.º 7, p. 79-95. Disponible en http://revistas.um.es/analesdoc/article/view/1691.
GILCHRIST, A. Overeenkomsten en verschillen: thesauri, taxonomieen en ontologieen (Similarities and differences: thesauri, taxonomies and ontologies). Informatie Professional, 2004, vol. 8, n.º 10, p. 24-25.
GUZMÁN LUNA, J.A., TORRES PARDO, D. y LÓPEZ GARCÍA, A. N. Desarrollo de una ontologia en el contexto de la web semántica a partir de un tesauro documental tradicional. Revista Interamericana de Bliotecología, 2006, vol. 29, n.º. 2, p. 79-94.
HYVONEN, E. Miksi asiasanastot eivat riita vaan tarvitaan ontologioita? (Why thesauri are not enough and ontologies are needed?). Signum, 2005, n.º 5, p. 5-11.
KIM, S. y BECK, H.W. A practical comparision between thesaurus and ontology thecniques as a baseis for search improvement. Journal of Agricultural & Food Información, 2006, vol. 7, n.º 4, p. 23-42.
KIRCZ, J., GORIS, G. y DRENTHE, G. Bouwstenen voor semantisch publiceren: van thesaurusverrijking naar ontologieen (Building blocks for semantic publishing: from thesaurus enrichment to ontologies). Informatie Professional, 2005, vol. 9, n.º 2, p.24-27.
MOREIRA, A., ALVARENGA, L. y PAIVA OLIVEIRA, A. de. "Thesaurus" and "ontology: " a study of the definitions found in the computer and information science literature, by means of an analytical-synthetic method. Knowledge Organization, 2004, vol. 31, n.º 4, p. 231-244.
SONG, M., et al. Integration of association rules and ontologies for semantic query expansion. Data & Knowledge Engineering, 2007, vol. 63, n.º 1, p. 63-75.
TSUJII, J. y ANADIADOU, S. Thesaurus or logical ontology, which one do we need for text mining? Language Resources & Evaluation, 2005, vol. 39, n.º 1, p. 77-90.
UNGVARY, R. Tezaurusz es ontologia, avagy a fogalmi ismertetojegyek generikus oroklodesenek formalizalasa (Thesaurus and ontology, or formalization of the generic inheritance of conceptual features). Tudomanyos es Muszaki Tajekoztatas, 2004, vol. 51, n º 5, p.175-191
WENG, S-S. et al. Ontology construction for information classification. Expert Systems with Applications, 2006, vol. 31, n.º 1, p. 1-12.
YUN, L., GUIYI, W. y JUN, L. An ontology-based approach of web texts Classification. Journal of the China Society for Scientific and Technical Information, 2006, vol. 25, n.º 2, p. 202-207.
Bibliografía
editar- GIL LEIVA, Isidoro. Manual de indización. Teoría y práctica. Gijón: Trea, 2008. ISBN: 978-84-9704-367-0