Was haben die beiden Datentypen Big Data und Metadaten miteinander zu tun und welche Rolle spielen letztere? Über Funktionsweise und Nutzen von Metadaten.
Das „Big“ in Big Data suggeriert, dass vor allem große Datenmengen entscheidend bei der Analyse von Big Data ist. Um richtige und aussagekräftige Erkenntnisse aus Daten abzuleiten, ist es jedoch wichtiger, über die wesentlichen Daten und Datentypen zu verfügen. Big Data bestehen aus unterschiedlichsten Formen von Daten. Bei der Analyse können interne und externe Daten verwendet werden. Daten aus dem Mailserver oder aus Social Media sind grundsätzlich verschieden von Sensordaten, die bei der Überwachung von Fertigungsanlagen anfallen. Metadaten stellen unter den verschiedenen Datentypen eine ganz besondere Form von Daten dar. Es sind Daten über Daten.
[selectivetweet]#Metadaten: Irgendwie einzigartig, irgendwie besonders. #BigData[/selectivetweet]
Schon rein ihrer Form nach sagen Metadaten also etwas über andere Daten aus. Verwertbare Aussagen sind demnach sehr schnell verfügbar. Letzteres wird bei der Anwendung von Big Data immer wichtiger: die Verfügbarkeit von Ergebnissen in Echtzeit.
Metadaten am Beispiel von digitalen Fotos
Jedes Foto, das mit einer digitalen Kamera aufgezeichnet wird, besteht aus Daten. Die einzelnen Pixel, die am Ende zusammen das Bild ergeben, sind Einzelinformationen über Farb- und Helligkeitswerte. Jede Bilddatei verfügt aber über noch viel mehr Informationen, nämlich über Metadaten:
- Wann wurde das Bild aufgezeichnet?
- Welche Verschlusszeit, welche Blendenöffnung und welches Programm wurde verwendet?
- Welcher ISO-Wert war eingestellt?
Verfügt eine Kamera über den entsprechenden Sensor werden auch die GPS-Daten vom Aufnahmeort abgespeichert. Diese Daten sind allesamt Metadaten, die Aussagen über die eigentlichen Daten – wenn man so will die “Primärdaten” – zulassen. Mithilfe der Metadaten lassen sich Fotos in vielerlei Hinsicht untersuchen. Am Ende eines Jahres helfen die Daten zum Beispiel dabei, das eigene Fotografierverhalten auszuwerten.
- Zu welcher Uhrzeit schieße ich die meisten Fotos?
- An welchen Orten auf der Welt habe ich meine Bilder aufgenommen?
- Habe ich oft versucht bei zu wenig Licht zu fotografieren oder habe ich fast immer das Standardprogramm verwendet?
Diese Informationen sind beispielsweise beim nächsten Kamerakauf interessant. Metadaten übernehmen aber noch eine weitere, überaus hilfreiche Funktion.
Metadaten sind digitale Archivare
Allgemein gesagt, liefern Metadaten also Informationen über Daten. Damit stellen sie eine Art Verschlagwortung dar und helfen dabei, Daten bei einer Suche zu identifizieren. Über die Metadaten von Digitalfotos lassen sich sehr leicht bestimmte Bilder aus einer großen Menge Bilder herausfiltern. Angenommen für eine Werbeanzeige wird ein Bild von einem Sonnenuntergang in Thailand benötigt – zwei Suchkriterien genügen, um in einem Fotoarchiv mit tausenden Bildern die richtigen Aufnahmen schnell zu finden. Aufnahmezeitpunkt und GPS-Informationen reichen aus, eine riesige Menge für die Suche uninteressanten Bilder auszuschließen.
Hier wird deutlich, warum Metadaten bei Big-Data-Analysen so entscheidend sind. Sie ermöglichen es, die Menge so stark zu verringern, dass eine Datenauswertung immer leichter wird. Zu früheren Zeiten legten Archivare Zettelkästen an, um den Aufenthaltsort von Dokumenten und Büchern in Archiven schnell zu finden. Diese Funktion übernehmen Metadaten in den digitalen Datenarchiven.
[selectivetweet]Metadaten sind digitale Archivare. Bei #BigData Analysen helfen sie, Aussagen in Echtzeit zu treffen.[/selectivetweet]
Unabhängig von der Rechenleistung erlauben Metadaten große Datenmengen handelbar zu machen. Je weniger Daten verarbeitet werden müssen, desto eher sind Ergebnisse in Echtzeit verfügbar. Die steigende Datenflut wird durch Metadaten beherrschbar und Big Data zu einem effektiven Arbeitsinstrument.