Die Ontologien hinter der „Forschungsinformationsplattform mit VIVO“
Wie Ontologien die Inhalte der Plattform verknüpfen
15.08.2022
Rolf Guescini zeigt im Interview auf, wie der Einsatz von Ontologien in der „Forschungsinformationsplattform mit VIVO“ die Verbindung von Forschungsinformationen über Disziplinen und Institutionsgrenzen hinweg ermöglicht.
Das Projekt „Forschungsinformationsplattform mit VIVO“ zielt darauf ab, Forschungsmetadaten innerhalb der Berlin University Alliance (BUA) in einer Plattform abzubilden und durchsuchbar zu machen. Möglich wird das durch Ontologien, welche die einzelnen Inhalte der Plattform semantisch verknüpfen. Rolf Guescini, IT-Entwickler am Projekt, treibt die Ontologie-Entwicklung für die Plattform maßgeblich voran. Im Gespräch gibt er Einblick in die Funktionsweise, Bedeutung, Herausforderungen und Chancen.
Rolf, wie würdest Du den Begriff „Ontologie“ vereinfacht erklären?
Der Begriff „Ontologie“ wird in verschiedenen Fachbereichen unterschiedlich definiert. In der Informatik nutzen wir ihn, um einen bestimmten Wissensbereich zu beschreiben. Die Ontologie enthält Begriffe, die ein Konzept in der Welt repräsentieren. Das kann konkret oder abstrakt sein. Gleichzeitig umfasst die Ontologie die Beziehungen zwischen verschiedenen Begriffen. Vereinfacht gesagt: Eine Ontologie umfasst Begriffe und Beziehungen innerhalb eines Wissensbereichs. Sie ist wie der Leim zwischen unterschiedlichen Informationsobjekten.
Wie funktionieren Ontologien?
Es handelt sich um eine Identifikator-basierte Technologie, jedem Konzept wird ein Identifikator zugeschrieben. So wird beispielsweise einem Pferd ein Identifikator zugeordnet, sodass wir uns miteinander ohne Zweifel über ein Pferd unterhalten können. Dahinter steckt die Idealvorstellung, dass wir überall auf der Welt eindeutig über ein Konzept sprechen können und Forschung dazu gesammelt abgebildet werden kann. In der Realität ist die Situation natürlich um ein Vielfaches komplexer.
Welche Rolle spielen Ontologien für die „Forschungsinformationsplattform (FIP) mit VIVO“ für die Berlin University Alliance?
Die „FIP mit VIVO“ ist eine semantische Plattform, die auf Ontologien basiert. Mit Hilfe der Open-Source-Software VIVO können wir den Endnutzenden ein Rahmenwerk bieten, in einfacher Umgebung mit diesen Ontologien zu interagieren.
Dazu werden alle Informationsobjekte, so genannte Entitäten, also zum Beispiel Personen, Publikationen oder Organisationselemente, in Ontologien repräsentiert. Die Ontologien wiederum bilden Netzwerke, so genannte Graphen, die mit Hilfe der Fragesprache „SPARQL“ abgefragt werden können. Die Verbindungen der Graphen ermöglichen es uns, in der Plattform neue, gar überraschende Zusammenhänge zwischen den Entitäten zu entdecken und zu visualisieren.
Welche Ontologien kommen in der „FIP mit VIVO“ zum Einsatz?
Innerhalb der VIVO-Software gibt es mehrere Ontologien, die unterschiedliche Aspekte repräsentieren – Forschende selbst, ihre Forschung, Publikationen und die Organisationsstruktur.
Wir nutzen die VIVO-Ontologie und erweitern diese für den europäischen Raum. Für die „FIP mit VIVO“ mussten wir zudem eine Ontologie entwickeln, welche die spezifische Organisationsstruktur der vier Verbundpartnerinnen der BUA abbildet.
Gleichzeitig können wir auf die Arbeit verschiedener Projekte zurückgreifen, um Publikationen und hoffentlich zukünftig auch Projekte und Forschungsdaten zu kategorisieren. Für die disziplinäre Klassifizierung von Forschungsfeldern nutzen wir die Ontologie von B2FIND EUDAT. Für interdisziplinäre Forschungsfeldklassifikationen greifen wir auf die Ontologie des Kerndatensatz Forschung zurück.
Welchen Herausforderungen bist Du bei der Ontologie-Entwicklung begegnet?
Die VIVO-Software wurde für den amerikanischen akademischen Raum entwickelt. Entsprechend beschreibt die VIVO-Ontologie Organisationselemente und Rollen für diesen Sprachraum. Zum einen werden an europäischen Institutionen andere Begriffe verwendet, zum anderen kommt es vor, dass Namen genutzt werden, die den amerikanischen Bezeichnungen ähnlich sind, aber eine andere Bedeutung haben als ihre englischsprachigen Entsprechungen. Daher musste die bestehende Ontologie erweitert werden, damit die europäischen Strukturen mit der korrekten Semantik beschrieben werden können.
Die Herausforderung bei der Entwicklung der BUA-Ontologie ist ganz ähnlich: Die gleichen Bezeichnungen, etwa für einen Fachbereich, haben bei den Verbundpartnerinnen der BUA mitunter unterschiedliche Bedeutungen. Entsprechend müssen wir die Ontologien harmonisieren, damit wir in der Plattform interdisziplinäre und institutionsübergreifende Ergebnisse abfragen und zusammenstellen können.
Ist die BUA-Ontologie-Erweiterung auch für andere Projekte in der VIVO-Community nutzbar?
Jedes Projekt hat natürlich lokale Attribute, die nur schwierig in einen größeren, allgemeingültigen Kontext übersetzt werden können. Da die VIVO-Community ihre Entwicklung jedoch auf Basis von „oberen“ oder generischen Ontologien aufbaut, von denen jedes Projekt erben kann, können wir davon ausgehen, dass unsere Erweiterungen auch für ähnliche Projekte im selben Sprachraum verwendbar sein werden.
Wie ist der Stand jetzt und wie sehen die nächsten Schritte aus?
Wir haben aktuell Personen erfasst, deren Publikationen und wir verknüpfen Personen zu den Organisationsstrukturen.
Wir wollen zukünftig Personen mit Projekten verknüpfen und Projekte wiederum mit den jeweiligen Forschungsoutputs verbinden. Außerdem wollen wir diese Strukturen mit anderen Projekten innerhalb der BUA verknüpfen, wie zum Beispiel dem Shared Services Catalogue.
Was können wir dadurch erreichen?
Den größten Mehrwert für alle Verbundpartnerinnen erreichen wir, wenn wir die unterschiedlichen Ontologien innerhalb der BUA verknüpfen und so in einen größeren Zusammenhang bringen.
Dann wird es möglich, Forschung in einem Bereich mit Hilfe gemeinsamer Kategorisierungen und gemeinsame Konzepte – und das über Disziplinen und Institutionsgrenzen hinweg – zu verknüpfen und darzustellen.
Wenn wir mit derartig verknüpften und großen Ontologien arbeiten, können wir über die Suchfunktion Verbindungen herstellen und Inhalte auffinden, die andernfalls nicht sichtbar wären. Damit wollen wir vor allem interdisziplinäre Forschung verbinden, visualisieren und letztendlich fördern.
Weitere Informationen
Kontakt: Rolf Guescini, IT-Entwicklung und Ontologien „FIP mit VIVO“