Big Data: Die Potentiale von Daten verstehen, Projekte daraus verwirklichen und seine Daten entfalten.

3,5 Zoll Disketten oder ZIP-Laufwerke wirken heute wie Relikte aus einem vergangenen Jahrhundert. Dabei ist es vergleichsweise wenige Jahre her, als Sony 2009 die Produktion von Disketten komplett einstellte. Mit der Entwicklung von optischen Speichermedien wie DVDs und Blu-Rays bzw. der enormen Steigerung von Kapazitäten von Festplatten wurden große Speicher zu günstigen Preisen realisiert. Zur Herausforderung wurden Speicherkapazitäten erst wieder, seit der Bedarf durch Big Data rasant gestiegen ist.

Zur Speicherung von sehr großen Datenmengen, wie sie etwa beim Teilchenbeschleuniger Large Hadron Collider in Genf anfallen, wird nach wie vor auf Magnetbänder zurückgegriffen. Diese sind vor allem in der Frühphase der Computerentwicklung verwendet worden. Die Menge an Daten, die wir weltweit erzeugen, wächst so schnell, dass die Speicherkapazitäten, die mit den heutigen Speichermedien möglich sind, bald überschritten werden. Alle derzeit verfügbaren digitalen Speichertechnolgien weisen zudem gravierende Mängel auf, so dass sich die Frage stellt, worauf in Zukunft alle Daten gespeichert werden.

Die folgende Dokumentation, die von arte France produziert wurde, zeigt die Geschichte und die Zukunft einiger Speichermedien:

Der Status quo

Im Bereich Big Data Analytics zeichnet sich in den letzten Jahren eine bevorzugte Methode ab, um vor allem Echtzeit-Analysen durchführen zu können. In einem Rechnerverbund, werden Daten in den Arbeitsspeicher (SSD) geladen, und dort in Echtzeit bearbeitet. Die Verfügbarkeit in Echtzeit wird in den meisten Anwendungsfällen immer wichtiger, da so Daten zur Entscheidungsgrundlage oder Echtzeit-Beratung (wie bei Einkaufstipps) genutzt werden können. Der größte Nachteil von Flash-Speichern: Sie können nicht beliebig oft beschrieben werden. Ihre Lebensdauer ist daher begrenzt und sie können nicht als sicherer dauerhafter Speicher verwendet werden. Ebenso schlecht sieht es bei der Haltbarkeit von Daten auf optischen Speichermedien wie DVDs oder Blu-Rays aus. Auch dort kann ein Datenverlust nach wenigen Jahren eintreten. Die momentan kostengünstigsten und praktischsten Datenspeicher sind daher nach wie vor magnetische Festspeicher (HDD).

[selectivetweet float=“left“]#BigData wächst exponentiell. Welche Strategien gibt es, wenn die Speicher voll sind?[/selectivetweet]

Die Hoffnungs(daten)träger: Holographic Versatile Disc und Racetrack

In zwei Bereichen bahnen sich Weiterentwicklungen von bestehenden Systemen an, die in einigen Jahren marktreif sein könnten. Allerdings würden in jedem Fall Brückentechnologien dringend benötigt werden, da die Neuerungen nach heutiger Einschätzung noch einige Zeit bis zur serienreife brauchen. Während sich im Bereich des heute sehr verbreiteten Flash-Speichers keine Neuerungen abzeichnen, könnte es insbesondere durch eine Weiterentwicklung zu einem Revival der optischen Speichermedien kommen. Bislang werden Daten nur auf der Oberfläche der Dateträgerschicht von optischen Datenträgern verwandt. Die Holographic Versatile Disc könnte durch die Ausnutzung der dritten Dimension Daten in mehreren Schichten speichern. Dadurch würde die Kapazität auf 4 Terabyte pro Medium und eine Zugriffsgeschwindigkeit von 1 Gigabit pro Sekunde steigern.

[display_posts post_type=“post“ number=“3″ posts=“1406,1311,1142″ layout=“grid“ headline=“Das könnte dich zum Thema Daten außerdem interessieren:“ button=““ button_link=““ orientation=“center“]

Im Bereich der Festplatten gibt es neben kleineren Neuerungen vor allem das Projekt des Racetracks. Dabei werden Daten in magnetischen Nanodrähten gespeichert, die in Bahnen angeordnet werden und an Rennbahnen erinnern. Durch ihren geringen Raumbedarf erreicht der Racetrack eine 100-mal höhere Speicherdichte im Vergleich zu SSDs. Die Zugriffsgeschwindigkeiten liegen ebenfalls weit jenseits der heutigen Standards. Obwohl es bereits 2011 gelungen ist, einen Prototypen herzustellen, ist unklar, wann ein Modell marktreif ist, das den Alltagsbedingungen stand hält.

Futuristische Speichertechnologien: DNA und Protein-coated-Discs

Die menschliche DNA ist im Grunde ebenfalls ein Informationsspeicher, der alle notwendigen Daten speichert, die zur Entwicklung eines Menschen benötigt werden. In Daten übersetzt entspricht der Bauplan des Lebens etwa der Größe von zwei CD-Roms (ca. 1500 MB). 2012 ist es einer Gruppe von Genetikern der Harvard Universität gelungen, Informationen in DNA zu erzeugen, zu codieren und zu decodieren. Wenn es gelingen sollte, DNA als Speichermedium in Zukunft nutzbar zu machen, hätte dies große Vorteile. Informationen, die auf biologische Weise gespeichert sind, werden:

  • platzsparend gespeichert,
  • die Speicherung benötigt keine Energie,
  • auch auf lange Zeit kommt es zu keinem Datenverlust.

Der größte Nachteil von DNA-Datenspeicher ist bislang: die extrem langsame Lese- und Schreibgeschwindigkeit.

[selectivetweet float=“left“]Wird #BigData künftig in Form von DNA gespeichert? Ja, biologische Speicher haben einige Vorteile.[/selectivetweet]

Eine andere Entwicklung aus dem Bereich der Biochemie ist die Entwicklung von DVD-ähnlichen Speichermedien, die mit einem Protein beschichtet sind. Diese Proteine, die auf Licht reagieren, werden von Bakterien gewonnen. Eine mit solchen Proteinen beschichtete DVD würde eine Kapazität von 50 Terabyte erlangen. Zum Vergleich: Unter Laborbedingungen speichert eine Blu-ray-Disc maximal 500 GB Daten. Doch auch die proteinbeschichteten Discs haben einen Makel: Sie sind bislang nur einige Monate lesbar.

Die Zukunft von Big Data: Gute Daten, schlechte Daten

Die Anforderungen von Big Data an Speichermedien werden sich in den nächsten Jahren dramatisch steigern. Die Sensoren des Internet der Dinge werden zu einer Explosion der Datenmenge beitragen. Da die Entwicklung der Speichermedien mit diesem Wachstum nicht Schritt halten wird, stellt sich in Zukunft immer mehr die Frage:

[longquote source=““]Welche Daten müssen archiviert werden, und welche sind nur für den kurz- und mittelfristigen Bedarf wichtig?[/longquote]

Den Wert der Daten einzuschätzen, ist, um zu entscheiden, was dauerhaft gespeichert wird und was nicht, nicht ganz einfach. Der Wert von historischen Daten kann sich erst im Rückblick herausstellen. Die Einteilung von Daten in gute Daten und „schlechte“, unwichtige Daten ebenfalls. Einer der Erfolgsfaktoren von Big Data hängt künftig demnach auch an der Entwicklung des Speichermediums der Zukunft.