Metadaten
Metadaten oder Metainformationen sind strukturierte Daten, die Informationen über Merkmale anderer Daten enthalten. Was sich kompliziert anhört, ist essentiell für zahlreiche Online-Geschäftsmodelle und Automatisierungslösungen.
Typische Metadaten zu einem Buch sind beispielsweise der Name des Autors, die Auflage, das Erscheinungsjahr, der Verlag und die ISBN. Bei einem Musikstück sind dies der Name des Interpreten, der Titel des Stücks, die Dauer, das Genre, das Album, auf dem das Stück enthalten ist, aber ggf. auch das Datum der Aufnahme in den Katalog oder die Anzahl der Streams/Käufe (für die „Beliebtheit).
Beliebig viele weitere Metadaten können je nach Anwendungszweck hinzukommen. So kann in einem Online-Shop die Größe und das Gewicht eines Artikels samt Verpackung wichtig für die Berechnung der Lieferkosten sein, Lagerbestand und Standortdaten zum Lagerfach können intern benötigt werden, um die Versandlogistik zu optimieren, und so weiter.
Jeder Produktkatalog und jeder Shop profitiert zudem davon, dass die Angebote von Interessenten auch problemlos gefunden werden können. Jede Fotosammlung ist nützlicher, wenn man gezielt nach Bildinhalten suchen kann. Und jeder Musikstreamingdienst lebt letztlich davon, dass Nutzer ihre Wunschmusik finden, auch wenn sie den Titel des Stücks oder den exakten Namen des Interpreten nicht kennen.
Wie wichtig Metadaten im Alltag sind, zeigen einige Beispiele:
- Eine gute Metadatenverwaltung kann entscheidend für den Nutzwert eines Dienstes sein. So sind die Fotoverwaltungsfunktionen von Googles und Apples Foto-Apps unter anderem deshalb so beliebt, weil nicht nur Metadaten aus den Fotos ausgelesen werden (wie Zeitpunkt und Ort der Aufnahme, Kameraeinstellungen), sondern mittels KI-Algorithmen auch Metadaten über Bildinhalte (Personen, Objekte, Szenen) extrahiert und bei der Suche berücksichtigt werden. So ist es dann mit wenig Aufwand möglich, alle Aufnahmen mit einer bestimmten Person, zu einem bestimmten Ereignis oder von einem bestimmten Motiv anzeigen zu lassen – Metadaten sei Dank. Die Software übernimmt die Metadatenerkennung und damit die Verwaltung der Fotos.
- Die Suche nach Produkten in einem Online-Shop, nach einem Musikstück oder Video bei einem Streamingdienst oder Empfehlungsfunktionen z.B. für „ähnliche“ Bücher oder Filme funktioniert nur dann zufriedenstellend, wenn geeignete Metadaten vorhanden sind und zum Vergleich herangezogen werden.
Unvollständige oder fehlerhafte Metadaten können zu unterschiedlichen Problemen führen:
- Studien belegen, dass etwa ein Fünftel der Stücke in den Datenbanken der Musikstreaming-Anbieter fehlerhafte Metadaten aufweisen. Dies bedeutet für die betroffenen Künstler zum Teil erhebliche Verluste, da ihre Stücke nicht gefunden bzw. geeignet empfohlen werden.
- Im Mai 2019 beklagte ein Entwickler einer beliebten iOS-App, dass seine Metadaten für die App infolge eines Updates „verschwanden“. Daraus resultierte, dass die App bei vielen relevanten Suchbegriffen im Appstore nicht mehr auftauchte, die Folge war ein unmittelbar damit verbundener Umsatzeinbruch um 44 Prozent.
- Und viele Nutzer ärgern sich über schlechte Suchergebnisse und Empfehlungen in Online-Shops. Ursache sind auch hier häufig nicht die zugrundeliegenden Algorithmen, sondern fehlerhafte oder fehlende Metadaten.
Auch in der „Smart Factory“ werden Metadaten immer wichtiger. Bei der Überwachung und Planung von Fertigungsprozessn, der Predictive Maintainance oder auch komplexen IoT-Lösungen ist es nicht nur wichtig, dass Daten über den Zustand der Maschinen in Echtzeit abgerufen werden können, sondern auch sämtliche Angaben über Typ, Alter, Standort der Maschine, zulässige Betriebsparameter und vieles mehr in Form von Metadaten vorliegen, die die eigentlichen Prozessdaten ergänzen und den Umgang mit ihnen erst effektiv möglich machen.
Probleme im Zusammenhang mit Metadaten können sein:
- teilweise fehlende bzw. „leere“ Metadaten: In diesem Fall sind einzelne Metadaten für bestimmte Angebote oder Prozessknoten entweder nicht erfasst oder aber gar nicht bekannt.
- komplett fehlende Metadaten: Da Metadaten strukturiert gespeichert und erfasst werden müssen, kann es passieren, dass wichtige Metadaten bei der Konzeption übersehen und damit gar nicht gespeichert werden.
- fehlerhafte Metadaten: Hier sind zwar Metadaten vorhanden, sie sind jedoch nicht korrekt. Dies kann beispielsweise durch menschlichen Irrtum, Fehler bei einer automatischen Klassifizierung oder schlicht Probleme bei der Dateninterpretation geschehen. Klassische Fehlerquellen sind auch (ausbleibende) Konvertierungen von Größen- und Gewichtsangaben – dann wird aus 1,3″ eventuell 1,3 cm und aus 1.200 g die Angabe 1,200 g – oder umgekehrt.
Ursachen dafür sind vor allem zwei Szenarien:
Häufig ist zu Beginn eines Projektes noch nicht klar ist, welche Metadaten später tatsächlich benötigt werden. Da es aufwendig sein kann, Metadaten zu erfassen und zu speichern, starten viele Projekte mit wenigen Metadaten und laufen in Probleme, wenn die Funktionalität später erweitert werden soll und nun unberücksichtigte Metadaten fehlen.
Bei Katalogsystemen werden Metadaten häufig von Drittanbietern angeliefert und nicht selbst erfasst. Da es aber keine Standards für die Metadatenerfassung gibt, stellen nicht alle Zulieferer die Daten vollständig und in der erwarteten Form zur Verfügung.
Sowohl die Konsistenzsicherung als auch der Umgang mit fehlenden und fehlerhaften Metadaten müssen daher unbedingt bereits bei der Projektplanung berücksichtigt werden – anderenfalls kann es zu unvorhersehbarem Systemverhalten und letztlich Akzeptanzproblemen bei der Systemnutzung kommen.
Fazit: Metadaten werden für moderne IT-Infrastrukturen immer wichtiger und müssen bei der Planung und Erweiterung von Anwendungen mit besonderer Sorgfalt berücksichtigt werden – auch im Hinblick auf die Zukunftssicherheit und Erweiterbarkeit der Lösung.
(Bild von mohamed Hassan auf Pixabay)