Rohdaten sind zunächst unanschaulich und bis zu einem gewissen Grad für das ungeübte Auge wenig gewinnbringend zu betrachten. Insbesondere bei Big Data sind die Datenmengen so groß, dass sie schon wegen ihrer Menge unanschaulich sind. Deswegen müssen Daten visualisiert werden und im Idealfall in eine ästhetische Form gebracht werden. Datenvisualisierung stellt aber nicht nur einen Prozess dar, Daten in eine besser wahrnehmbare Form zu bringen. In dem Vorgang der Darstellung stellt zugleich einen Teilaspekt der Analyse und Interpretation der Daten dar. Muster, und Zusammenhänge werden zum Teil erst durch die Visualisierung erkennbar. Dieser Vorgang ist deswegen nicht “nur” der abschließende Schritt bei der Big-Data-Projekten, damit die Ergebnisse präsentiert werden können.
Die hier zusammengestellten Tools richten sich eher an Entwickler oder Menschen, die Erfahrung mit Programmierung und Datenbankmanagement haben. Das Angebot an Tools ist inzwischen sehr umfangreich und vielfältig. Je nach Zweck und Software-Skills gibt es unterschiedliche Speziallösungen. In den nächsten Teilen stellen wir Tools für Einsteiger und Fortgeschrittene vor. Die Möglichkeiten Daten zu visualisieren sind im Prinzip endlos und nur von der Fantasie der Nutzer und dem verwendeten Werkzeugen abhängig. Einen guten Überblick über die aktuellen Möglichkeiten zu haben, dient nicht nur der Ideen-Anregung, sondern zeigt zugleich, welche Optionen zur Verfügung stehen.
Charts.js
Die Open Source Java-Script-Bibliothek Charts.js bietet lediglich sechs verschiedene Charttypen: Linien, Balken, Netz, Doughnut, Kuchen und Polar-Area. Obwohl das Programm nur wenige KByte groß bzw. klein ist, hat es im Vergleich zu den vielen anderen, ebenfalls kostenlosen Lösungen, einen großen Vorteil: Es produziert wirklich außergewöhnlich gut aussehende Diagramme auf Basis von HTML5, CSS3 oder JavaScript im Browser, die alle interaktiv sind. Die Dokumentation liefert schöne Beispiele für das Können von Charts.js.
D3.js
Die drei “Ds” im Firmennamen von D3.js stehen für “Data Driven Documents” und ist eine der besten Lösungen für Datenvisualisierung. Vor allem bekannt und geschätzt ist D3.js für seine großen Bibliothek mit einer atemberaubenden Fülle von Visualisierungen. Hier sollte für fast jeden etwas dabei sein. Für das folgende Beispiel nutzte etwa die New York Times.Egal ob für die Visualisierungen HTML, CSS und SVG genutzt wird, Charts mit D3.js sind eine anspruchsvolle Aufgabe. Zudem haben ältere Browser immer wieder Probleme mit der richtigen Darstellung der Charts.
dygraphs
Mit dygraphs bekommt man ein Tool an die Hand, das schnell, flexibel und hochdynamisch ist. Die Open Source Java-Script-Bibliothek ist speziell auf große Datenmengen ausgelegt. Der Funktionsumfang ist deswegen vielleicht nicht so groß wie bei den Alternativen. Aber da die Fähigkeit, gut mit Big Data umzugehen, hier im Fokus steht, macht dygraphs zum Helden der Stunde. Viele Use-cases, die verdeutlichen, was dygraphs kann, finden sich in der Galerie auf der Homepage.
FusionCharts
Wenn es um Reichhaltigkeit bei der Sammlung von Charts, Karten und Graphen geht, wird D3.js nur von FusionCharts überflügelt. Bei knapp 100 Chart-Typen und 1000 verschiedenen Karten dürfte für jeden etwas dabei sein. Das Javascript-Framework kann Charts in PNG, JPEG, SVG oder PDF exportieren. Alle Charts lassen sich mit vielen kleinen Details und Features individualisieren und interaktiv gestalten. All das hat seinen Preis, der nach der kostenlosen Testphase zu Buche schlägt.
Gephi
Die Visualisierung von Netzwerken im weitesten Sinne ist das Spezialgebiet von Gephi. Der Funktionsumfang und der Reichtum der Darstellungsmöglichkeiten ist dabei beeindruckend. Das folgende Video gibt einen guten Überblick über die Möglichkeiten von Gephi: https://vimeo.com/9726202 Wer wissen möchte, wie sein Netzwerk bei Facebook, LinkedIn oder Xing als grafisches Netzwerk visualisiert aussieht, kann sich mittels des Tutorials an Gephi versuchen. Für Ungeübte sind letztere notwendig, da es nicht ganz einfach ist, die Daten so zu strukturieren, dass sie die gewünschten Ergebnisse liefern. Die Netzwerkforschung mit Gephi richtet sich nicht nur an interessierte Privatanwender, sondern vor allem an Wissenschaft und Wirtschaft. Im Bereich B2B oder im Marketing sind Netzwerkanalysen ein wertschöpfender Anwendungsfall von Data Mining.
Google Charts
Es gibt kaum einen Bereich, in dem Google nicht aktiv ist. Mit Google Charts mischt Google auch im Bereich Datenvisualisierung mit. Eine große Stärke ist systemimmanent: Mit Google Charts kommt man in den Nutzen aller Vorteile des Internet-Giganten. Angefangen von guter Auffindbarkeit bei Google bis hin zur Kompatibilität über alle Browser und Betriebssysteme hinweg. Letzteres wird gewährleistet, indem die Charts mit HTML5/SCG gerendert werden. Im kostenlosen Angebot sind die wichtigsten Chart-Typen wie Kuchen, Balken, Pegel oder Landkarte enthalten.
Highcharts
Laut eigenen Angaben nutzen 61 der 100 umsatzstärksten Firmen der Welt eines der Produkte von Highcharts. Dennoch verschenken die sympathischen Norweger ihre Bibliothek an alle nicht-kommerziellen Projekte, die Highcharts verwenden möchten. Darin finden sich eine ganze Menge von gängigen Charts und Karten. Exportiert wird in JPG, PNG, SVG und PDF und verspricht maximale Browserkompatibilität.
Seit die webbasierte, grafische Benutzeroberfläche entwickelt wurde, ist Highcharts sogar relativ leicht zu bedienen.
iCharts
iCharts ist eine webbasierte Software, die Datenvisualisierung für kleine, mittlere und große Unternehmen anbietet. Das Firmenlogo wird automatisch in die Charts, Grafen und Diagramme eingearbeitet. Die Visualisierungsmöglichkeiten sind sehr ausgefeilt, können interaktiv gestaltet werden und bieten Anschlussmöglichkeiten an das Social Web. In der kostenfreien Basisversion lassen sich nur öffentliche Charts im iCharts-Channel erstellen. Mit den nach oben gestaffelten Preisgruppen, erhöht sich der Funktionsumfang dann bedeuten. Dann lassen sich die Charts und Diagramme auch auf die Firmenhomepage integrieren und für SEO optimieren.
Quadrigram
Quadrigram kommt mit einer ganzen Bibliothek von interaktiven Visualisierungen daher. Diese können mit den eigenen Datenbanken kombiniert werden und da es keine vorgefertigten Muster gibt, muss für jeden Fall eine individuelle Lösung gefunden werden. Der Funktionsumfang der flexiblen Cloud-Software ist entsprechend groß. Quadrigram richtet sich sowohl an Kunden wie Start-ups, die mit ihrer Geschäftsidee noch am Anfang stehen, aber auch an Großkonzerne und lässt sich entsprechend anpassen. Entwickler werden mit Darstellungsoptionen wie Wärmekarten, 3D-Netzen und Polygonen ihre Freude haben.
Visualize Free
Die kostenlose Version Visualize Free basiert auf dem kommerziellen Service von InetSoft. Sie erlaubt es, große Datasets im Exel- (XLS und XLSX) oder CVS- bzw. TXT-Format hochzuladen. Mehrere Chart-Typen stehen zur freien Verfügung: Wortgrafiken, Histogramme, Blasen, Gitternetze, Bulletpoint-Graphen, Multi-Charts und Landkarten. Wenn mehrere Datasets mit einer recht simplen Drag- und Drop-Funktion eingerichtet sind, ist die Verarbeitung von Daten sehr einfach gehalten.
[selectivetweet]Ein Petabyte Daten ist viel & unanschaulich. Diese 10 Tools helfen bei der Visualisierung. #BigData[/selectivetweet]
Lese auch: Freie Big-Data-Tools – Entdecke die Möglichkeiten