Benutzerspezifische Werkzeuge

Ontologien

Eine Ontologie ist ein formales Wissensmodell, das im Wissensmanagement, in Experten- und Multiagentensystemen, bei der Informationsintegration und insbesondere im Semantic Web für die Bereitstellung von Wissensstrukturen, für Wissensorganisation oder als Basis der automatisierten Wissensverarbeitung genutzt wird.

Grundlagen

Der Begriff der Ontologie hat zwar eine lange Tradition in der Philosophie und den Sprachwissenschaften, wurde aber erst in den 1990er Jahren als technischer Terminus der Künstlichen Intelligenz in die Informatik eingeführt (vgl. [Staab, Studer 2003]). Die ursprüngliche Motivation war:

  • einerseits im Bereich der Expertensysteme (XPS) weitgehend anwendungsunabhängig modellierte Domänenmodelle für die Wiederverwendung bereitzustellen [Heijst et al. 1997; Studer et al. 1998];
  • andererseits in Multiagentensystemen (MAS) und verteilten wissensbasierten Systemen durch explizite Modelle von domänenspezifischem Vokabular eine gemeinsame Kommunikationsbasis für den Nachrichtenaustausch in Sprechakten zu schaffen [Gruber 1995].

Eine möglichst vollständige aktuelle Definition umfasst folgende Aspekte:

Eine Ontologie ist:

  • eine explizite, formale Spezifikation
  • der Konzeptualisierung eines abgegrenzten Diskursbereichs zu einem definierten Zweck
  • auf die sich eine Gruppe von Akteuren geeinigt hat.

Einige dieser Begriffe seien weiter erläutert:

  • Der Einigungsaspekt rührt daher, dass die Ontologienutzung immer in gewisser Weise direkt oder indirekt Kommunikation zwischen Akteuren ermöglichen oder vereinfachen soll. Dies geschieht dadurch, dass die Akteure sich auf eine "gemeinsame Sprache" einigen, die Ontologie. Dies wird offensichtlich bei der Nutzung für den Nachrichtenaustausch in Multiagentensystemen, aber auch in aktuelleren Verwendungen wie der Intelligenten Informationsintegration aus heterogenen Quellen (Ontologien als Ausgangs-, Ziel- oder Zwischenformate helfen bei der voll- oder teil-automatischen Schematransformation) oder bei der Suche in Informationsportalen oder Retrieval-Systemen im Wissensmanagement (die Ontologie repräsentiert die zwischen Dokument-Indexierendem und Dokument-Suchendem geteilte, einheitliche Struktursicht zur Wissensorganisation).
  • Eine Konzeptualisierung umfasst die Begriffe und Zusammenhänge, die einen Diskursbereich strukturieren. Konzeptualisierungen in Ontologien umfassen in aller Regel eine Taxonomie von Begriffen (auch: Konzepte, Klassen), welche Attribute (auch: Merkmale, Eigenschaften) besitzen und durch Beziehungen (Relationen) miteinander verknüpft sein können. Axiome können Kardinalitäten, Wertebereiche oder auch Default-Werte von Relationen oder Attributen beschreiben, ebenso wie Eigenschaften von Beziehungen (Symmetrie, Transitivität, Reflexivität, inverse Beziehungen); einige Ontologiesprachen bieten weiterhin die Möglichkeit, Relationen taxonomisch anzuordnen. Häufig können auch Regelsprachen zur Formulierung von Integritätsbedingungen oder weiterem Herleitungswissen für die Beschreibung impliziter Zusammenhänge verwendet werden. 
    Im Gegensatz zu einem objektorientierten konzeptuellen Datenschema plus expressivem Regelformalismus, kann eine Ontologie überdies auch Instanzen (Objekte) von Begriffen und ihre Attributwerte sowie instanziierte Beziehungen enthalten, also Instanzen zueinander  in Beziehung setzen. Häufig wird als Teil bzw. Ergänzung der Konzeptualisierung auch eine lexikalische Ebene beschrieben (lexical layer), welche (für eine oder auch für mehrere natürliche Sprachen) die natürlichsprachigen Wörter enthält, mit denen man in Texten bestimmte Begriffe, Beziehungen oder Instanzen der konzeptuellen Ebene referenziert.  
  • Eine explizite Spezifikation bedeutet zunächst, dass die Konzeptualisierung in einer möglichst eindeutigen und möglichst wenig fehl-interpretierbaren Form niedergeschrieben wird. In bestimmten Anwendungen könnte dies schon durch semi-strukturierte Texte für die menschliche Nutzung passieren. Im Normalfall benutzt man aber spezielle Ontologie-Repräsentationssprachen, deren Semantik vollständig und eindeutig spezifiziert sein sollte; dies geschieht im Allgemeinen mithilfe der mathematischen Logik. Die erste Generation von Ontologiesprachen griff die Modellierungsansätze der semantischen Netze, der Frames und der Beschreibungslogiken auf. Heute basiert man sich idealerweise zumindest im Kern seiner Wissensrepräsentation auf weitgehend maschinenverarbeitbare Sprachen, die das World Wide Web Consortium (W3C) standardisiert, wie insbesondere das Resource Description Framework (RDF) und RDF Schema für web-basierte Metadaten und einfache Ontologien, die Web Ontology Language (OWL) auch für komplexere Ontologien, sowie das Rule Interchange Format (RIF) für Regeln. Im Bereich der Regeln gibt es auch noch weitere verbreitete Sprachen, wie z.B. SWRL als Kombination von OWL und Regeln oder F-Logic, eine Regelsprache im Stil der Logik-Programmierung.

Arten und Inhalte von Ontologien

Es gibt vielfältige Arten und auch Klassifikationen von Ontologien, vgl. [Gomez-Perez et al. 2004]. Eine der weitest zitierten Klassifikationen geht auf Guarino zurück (vgl. [Guarino 1998]) und unterscheidet (1) Top-Level Ontologien (sehr allgemeine Konzepte, die die Welt grundsätzlich strukturieren); (2) Generische Ontologien (häufig wiederverwendbare Modelle von wichtigen Aspekten der Welt, wie Zeit, Raum, usw.); (3) Domänen-Ontologien (beschreiben anwendungsunabhängig einen Diskursbereich, bspw. Maschinenbau oder Lungenkrankheiten; instanziieren und verfeinern (1) und nutzen (2)); (4) Aufgaben-Ontologien (beschreiben domänenunabhängig Aufgabentypen und ihre Wissenszusammenhänge, bspw. Diagnose; instanziieren (1) und nutzen (2)); (5) Applikations-Ontologien (führen (3) und (4) für ein wissensbasiertes System zusammen).

Eine weitere nützliche Klassifikation geht auf van Heijst zurück (vgl. [van Heijst et al. 1997]) und unterscheidet (A) Terminologische Ontologien (beschreiben insbesondere, wie Menschen über eine Domäne reden; bilden also die Verbindung zu Thesauri, Information Retrieval etc.); (B) Informationsontologien (beschreiben die Struktur und Meta-Eigenschaften von Informationsquellen, könnten also insbesondere in der Informationsintegration Verwendung finden); (C) Wissensontologien (stellen sehr detaillierte und formal "saubere" Wissensmodelle dar, wie man sie bspw. in Expertensystemen benötigt).   

Bereiche mit bereits sehr umfangreicher und erfolgreicher "ontologischer Durchdringung" sind beispielsweise die Genetik und Genom-Forschung oder auch Medizin und Lebenswissenschaften insgesamt (s. z.B. http://www.geneontology.org/). Bekannte Top-Level Ontologien sind DOLCE [Gangemi et al. 2002] oder die IEEE Sugested Upper Merged Ontology (SUMO, vgl. http://suo.ieee.org/SUO/SUMO/). Im Bereich eher leichtgewichtiger Ontologien hat das Format FOAF (friend-of-a-friend, siehe http://www.foaf-project.org/) zur Beschreibung von Menschen, ihren Internet-Präsenzen und ihren sozialen Netzwerken eine große Verbreitung erlangt. Wichtige Informationsontologien betreffen z.B. die Beschreibung von Web Services mit Metadaten (s.w.u., vgl. zum Beispiel OWL-S, WSMO oder WSDL-S vgl. [Studer et al. 2007]).   

Ontologie-Nutzung

Heute kann man die Hauptanwendungsfelder von Ontologien im Semantic Web und im Wissensmanagement identifizieren:

  • Semantische Suche: bei der Suche in komplexen, unübersichtlichen oder sogar unbekannten Informationsbeständen können Ontologien je nach Nutzungsszenario, Inhalt und Formalisierungsgrad vielfältige Mehrwerte liefern: auf der Seite der Anfrageformulierung können durch Heranziehen des ontologischen Strukturwissens Anfragen disambiguiert, ergebnisabhängig verallgemeinert oder spezialisiert, kontext- oder benutzerspezifisch adaptiert oder korrigiert werden; bei der Anfrage-Bearbeitung kann ontologisches Herleitungs- und definitorisches Wissen zur Überbrückung großer Diskrepanzen in Anfrageformulierung und Dokument-Repräsentation dienen, ferner Hintergrundwissen zur ähnlichkeitsbasierten Suche herangezogen werden; bei der Dokument-Repräsentation können ontologisch strukturierte Metadaten bzw. Metadaten über ontologisch beschriebene Domänen komplexe Dokument-Inhalte beschreiben, Dokumentzusammenhänge oder Verknüpfungen zwischen informellen (multimedialen) und formalen Inhalten (Datenbank-Inhalte) ermöglichen oder auch Meta-Beschreibungen zu Dokumenten geben (bspw. über inhaltliche Qualität); schliesslich können bei der Ergebnispräsentation über Ontologien formulierte benutzer- oder kontextspezifische Präsentations- oder Sortierregeln verwendet werden, Wissenstruktur-Zusammenhänge die Basis für Informationsvisualisierung darstellen, oder auch wissensbasierte Auswertungen über Retrieval-Ergebnissen erfolgen.  
  • Intelligente Informationsintegration: Ontologien können als sehr ausdrucksfähige konzeptuelle Schemabeschreibungssprachen helfen, bei der Integration von Informationen aus unterschiedlichen Quellen Übersetzungs- und Transformationsvorschriften mit Ontologiesprachen bequem zu formulieren, oder diese ganz oder teilweise automatisiert erstellen; sie können Konsistenzüberprüfungen mit ontologischem definitorischem Wissen erleichtern; sie bieten auch komfortable Möglichkeiten, auf der Anfrageseite das Informationsmodell um zusätzliche Konzepte anzureichern, die durch Zusammenführung und intelligente Bearbeitung von Quelldaten entstehen können.
  • Wissensbasierte Beratungs- und Assistenzsysteme: in der Tradition von Expertensystemen, deren Zielsetzung es ursprünglich war, schwierige Aufgaben (wie Planung, Diagnose, Konfiguration, Prozesskontrolle, Tutoring, ...) vollautomatisch zu lösen, gibt es heute auch andere Ansätze im Sinne eines "Mensch-Computer-Tandems" nützliche Kombinationen von menschlicher Problemlösetätigkeit und maschineller Teilautomatisierung zu finden. Typische Beispiele wären intelligente Such- und Hinweisfunktionen in Call Centers, wo menschliche Mitarbeiter die Kundenprobleme zu lösen versuchen, dabei aber effizient mit Informationen versorgt werden sollen; oder auch sogenannte "Critiquing" Komponenten, die beispielweise einen Ingenieur beim Konstruieren "beobachten" und dabei die Einhaltung gewisser Vorschriften oder das Beachten von Optimalitätszielen überprüfen.
  • Semantische Infrastrukturen: Ansätze wie Semantic Web Services, Semantic Peer-to-Peer, Semantic Grid oder auch allgemein Semantic Software Engineering greifen bekannte Paradigmen des verteilten Rechnens auf, setzen zur Ressourcenbeschreibung (von Diensten, Peers, Grid-Ressourcen, Software-Modulen etc) aber ontologiebasierte Metadaten ein. Dies eröffnet allerlei Kombinationen der Nutzeneffekte der oben angeführten drei Verwendungsklassen, bspw. können Semantische Web Services oder semantisch beschriebene (d.h. mit Bezug auf Ontologien beschriebene) Software Module dann ggf. durch Methoden der semantischen Suche leichter in Repositorien oer Registries aufgefunden werden, durch Verwendung regelbasierter Mechanismen leichter automatisch kombiniert oder adaptiert werden, ihre Schnittstellen können durch Ontologie-Mapping aus der Informationsintegration aufeinander abgestimmt werden, usw. usf.

Darüberhinaus gibt es mancherlei aktuelle Forschungsfragen und spezielle Ansätze, wie z.B. die Idee des Semantic Desktop, die Nutzung von ontologischem Hintergrundwissen im Data Mining oder die Kombination von ontologiebasierten Ansätzen und Methoden der Social Software. Grundsätzlich bieten sich ontologiebasierte Methoden an, wenn sehr verfeinerte Auswertungen erforderlich sind oder wenn ein sehr komplexer oder unübersichtlicher Anwendungsbereich komfortable Modellierungsmethoden als zusätzliche Abstraktionsebenen erfordert; das Themenfeld der Ambient Intelligence bzw. Pervasive Computing ("Internet der Dinge") bietet hier z.B. für beide Phänomene Herausforderungen. Weitere ontologiebasierte Anwendungen finden sich in [Cardoso et al. 2007].

Ontologie-Erstellung, -Methoden und -Werkzeuge

Es gibt eine Reihe weitverbreiteter Methoden zur Ontologie-Erstellung ("Ontology Engineering"), beispielsweise als Fortführungen früherer Modellierungsansätze für Produkte und Prozesse (IDEF5, http://www.idef.com/IDEF5.html ) oder auf der Basis von Geschäftsprozess-Analysen (z.B. DECOR [Abecker 2004]), ebenso wie "native" Ontologie-Modellierungsmethoden, z.B. On-To-Knowledge [Sure 2003] oder METHONTOLOGY [Gomez-Perez et al 2004]. Neuere Ansätze betonen den Einigungsaspekt stärker (z.B. DILIGENT [Vrandecic et al. 2005]), akzentuieren vernetzte und modulare Ontologien sowie den Ontologie-Lebenszyklus und die Ontologie-Evolution über die Zeit hinweg, oder integrieren neuere Ideen aus Informatik und Software Engineering, wie z.B. Entwurfsmuster oder kollaborative Ansätze.

Ebenso existieren vielfältige kommerzielle und nicht-kommerzielle Werkzeuge für die Ontologie-Modellierung (vgl. [Gomez-Perez 2004]; insbesondere Protégé, s. http://protege.stanford.edu/ ), für die Speicherung und das Management von Ontologien (z.B. das KAON- oder das NEON-Toolkit, s. http://neon-toolkit.org/ ) oder auch für die Unterstützung des Ontology Engineering mit Methoden des maschinellen Lernens und der Textanalyse [Cimiano 2006]. Weiterhin gibt es natürlich vielfältige nachgelagerte, auf Ontologien beruhende Anwendungssoftware; diese enthält häufig:

  • Annotationswerkzeuge zur ontologiebasierten Metadaten-Erzeugung für Dokumente oder Informationsquellen in der semantischen Suche [Uren et al. 2006]
  • Werkzeuge für das sog. "Ontology Mapping", bei dem halb- oder vollautomatisch unterschiedliche Ontologien für Zwecke der Nachrichtenübersetzung oder Informationsintegration aufeinander abgebildet werden [Euzenat, Shvaiko 2007]
  • Reasoner für automatisches Schlussfolgern mit Ontologien (beispielsweise Pellet, FaCT++, Kaon2, RacerPro; für einen Vergleich einiger Reasoner siehe z.B. [Volz 2008])

In der betrieblichen Praxis ist eine Ontologie als Modell ein zweck-orientiert gestaltetes Ingenieur-Artefakt, bei dem man versucht, durch ausführliche deklarative Beschreibung von Entwurfsentscheidungen der Modellierung die Möglichkeiten der Fehl-Interpretation zu reduzieren und die Möglichkeiten sinnvoller maschineller Interpretation und Verarbeitung zu erhöhen. Grundsätzlich besteht in der betrieblichen Praxis beim Modellieren natürlich ein Zielkonflikt (trade-off) zwischen dem sogenannten "Sharing Scope" und dem Maß an Anwendungsunabhängigkeit einerseits und dem Modellierungsaufwand bzw. der zeitlichen Stabilität einer Ontologie andererseits (vgl. auch [Elst, Abecker 2002]). Ein weiterer trade-off betrifft beispielsweise das Maß an Formalität und Vollständigkeit der Modellierung, welche ein hohes Maß an automatischen Diensten ermöglichen, dafür aber Aufwand und Schwierigkeit der Ontologie-Erstellung und -Wartung erhöhen (s. [Hepp 2007] für eine Diskussion solcher Praxiserwägungen im Ontology Engineering).

Aktuelle Herausforderungen im Bereich der Erstellung und Verwendung von Ontologien sind nach wie vor die Ergonomie im Umgang mit großen Ontologien, Kosten-Nutzen-Betrachtungen bei Ontologie-Erstellung und -Evolution, praktische Anwendungsszenarien, skalierbares Reasoning u.v.a.m.

Literatur

Abecker, Andreas: Business-Process Oriented Knowledge Management: Concepts, Methods, and Tools. Dissertation, Institut AIFB, Universität Karlsruhe (TH), 2004.

Cardoso, Onelio Jorge; Hepp, Martin; Lytras, Miltiadis (Hrsg): Real-world Applications of Semantic Web Technology and Ontologies. Berlin, Heidelberg, New York, Tokyo: Springer-Verlag, 2007. 

Cimiano, Philipp: Ontology Learning and Population from Text: Algorithms, Evaluation and Applications. Berlin, Heidelberg, New York, Tokyo: Springer-Verlag, 2006.

Elst, Ludger van; Abecker, Andreas: Ontologies for Information Management: Balancing Formality, Stability, and Sharing Scope, Expert Systems with Applications, 23(4):357-366, Elsevier, 2002.

Euzenat, Jérôme; Shvaiko, Pavel: Ontology Matching. Berlin, Heidelberg, New York, Tokyo: Springer-Verlag, 2007.

Gangemi, Aldo; Guarino, Nicola; Masolo, Claudio; Oltramari, Alessandro; Schneider, Luc: Sweetening Ontologies with DOLCE. In: EKAW-2002, S. 166-181. Berlin, Heidelberg, New York, Tokyo: Springer-Verlag, 2002.

Gomez-Perez, Asuncion;  Fernandez-Lopez, Mariano;  Corcho-Garcia, Oscar: Ontological Engineering. Berlin, Heidelberg, New York, Tokyo: Springer-Verlag, 2004. 

Guarino, Nicola (Hrsg.): Formal Ontology in Information Systems. Amsterdam, Berlin, Oxford: IOS Press, 1998.

Gruber, Thomas R.: Toward Principles for the Design of Ontologies Used for Knowledge Sharing. International Journal Human-Computer Studies 43(5-6):907-928, Elsevier, 1995.

Heijst, Gertjan van; Schreiber, Guus; Wielinga, Bob: Using Explicit Ontologies in KBS Development. International Journal of Human-Computer Studies 46(2-3):183-292, Elsevier, 1997.

Hepp, Martin: Possible Ontologies: How Reality Constrains the Development of Relevant Ontologies. IEEE Internet Computing 11(1):90-96, 2007.

Staab, Steffen; Studer, Rudi (Hrsg.): Handbook on Ontologies in Information Systems. Berlin, Heidelberg, New York, Tokyo: Springer-Verlag, 2004.

Studer, Rudi; Benjamins, V. Richard; Fensel, Dieter: Knowledge Engineering: Principles and Methods. Data and Knowledge Engineering 25(1-2):161-197, Elsevier, 1998.

Studer, Rudi; Grimm, Stephan; Abecker, Andreas: Semantic Web Services – Concepts, Technologies and Applications. Berlin, Heidelberg, New York, Tokyo: Springer-Verlag, 2007.

Sure, York: Methodology, Tools and Case Studies for Ontology based Knowledge Management. Dissertation, Institut AIFB, Universität Karlsruhe (TH), 2003.

Uren, Victoria; Cimiano, Philipp; Iria, José; Handschuh, Siegfried; Vargas-Vera, Maria; Motta, Enrico; Ciravegna, Fabio: Semantic Annotation for Knowledge Management: Requirements and a Survey of the State of the Art. Journal of Web Semantics 4(1):14-28, Elsevier, 2006.

Volz, Raphael (Hrsg.): Semantics at Work: Ontology Management - Tools and Techniques. eBook, verfügbar bei: http://www.lulu.com/content/1969742. Letzter Zugriff: 01.09.2008.  

Vrandecic, Denny; Pinto, Sofia; Sure, York; Tempich, Christoph: The DILIGENT Knowledge Processes. Journal of Knowledge Management 9(5): 85-96, Emerald, 2005.

       

Autor


 

Prof. Dr. Rudi Studer, Universität Karlsruhe (TH), Institut für Angewandte Informatik und Formale Beschreibungsverfahren - AIFB, 76128 Karlsruhe

Autoreninfo


Zuletzt bearbeitet: 22.11.2016 18:14
Letzter Abruf: 27.03.2017 18:25
Artikelaktionen