Big Data: Die Potentiale von Daten verstehen, Projekte daraus verwirklichen und seine Daten entfalten.

Big Data bietet Unternehmen jede Menge neuer Möglichkeiten, stellt aber auch neue Anforderungen an Datenhaltung und Analyse. Im Beitrag „Real-Time Analytics mit NoSQL“ werden wesentliche Eigenschaften beleuchtet, die eine NoSQL-Datenbank wie MongoDB hinsichtlich der horizontalen Skalierbarkeit und Performance großer Datenmengen bietet. Mit der Business Analytics Suite von Pentaho lassen sich diese Daten verständlich aufbereiten und in geschäftsrelevante Informationen verwandeln – was die Wertschöpfung von Geschäftsprozessen deutlich erhöht.

Das Bedürfnis der Anwender nach Verständlichkeit und ansprechender Darstellung steigt parallel zur Datenflut. MongoDB und Pentaho im Unternehmenseinsatz zusammenzubringen, ist deshalb ein äußerst vielversprechender Ansatz. Die Kombination beider Tools ermöglicht Anwendern, operative Unternehmensdaten durch echtzeitnahe Analyse und grafische Aufbereitung zu strategisch relevanten Kennzahlen zu veredeln. Der native Datenzugriff verknüpft die Vorteile eines Document-DBs mit den grafischen und benutzerfreundlichen Verwaltungs- und Analysewerkzeugen der Pentaho Business Analytics Suite. Das reduziert den Schulungs- und Wartungsaufwand, erlaubt neue Formen der Datenanalyse und -modellierung und ermöglicht auch nicht-technischen Nutzergruppen, direkt mit der Datenbank zu interagieren.

MongoDB und Pentaho: Nahtlose Integration und leistungsstarke Analysen

MongoDB kann auf Grund des Shardings mehrerer Server auch eine sehr große Anzahl strukturiert und unstrukturiert vorliegender Daten sehr schnell bereitstellen. Um diese Daten in kurzen Intervallen analysieren und bewerten zu können, bedarf es einer geeigneten Software. Pentaho Business Analytics ist solch eine Datenanalysesoftware. Sie besteht aus verschiedenen Modulen und deckt unterschiedliche Bereiche der Business Intelligence (BI) ab. Dazu zählen u.a. der ETL-Bereich, Reporting, OLAP und Data Mining, die das gesamte Spektrum von Operational Intelligence bis hin zu Self-Service-BI bedienen.

Pentaho nutzt zur Interaktion grafische Drag&Drop-Oberflächen, die das Arbeiten mit einer technischen Anwendung wie MongoDB erleichtern. Pentaho integriert MongoDB nativ. Das heißt: Pentaho greift direkt auf die von MongoDB bereitgestellten Funktionen und Inhalte wie das Aggregation Framework, die Tag Sets und die Replikationen zu. Das beschleunigt die Verfügbarkeit von Unternehmensdaten für alle Nutzergruppen und hilft, die Produktivität zu verbessern.

 Integration der Datenbank MongoDB in die Pentaho BA Suite

Integration der Datenbank MongoDB in die Pentaho BA Suite

Direkte Datenverarbeitung aus NoSQL-Speichern

Eine zentrale Aufgabe im BI-Umfeld sind Extraktions-, Transformations- und Ladeprozesse (ETL). Um die von MongoDB bereitgestellten Daten direkt zu integrieren, nutzt Pentaho seine umfassende Datenintegrationsplattform Pentaho Data Integration (PDI). PDI ist ein grafisches ETL-Tool zum Laden und Verarbeiten der in MongoDB hinterlegten Daten. Mittels Data Blending und interaktiven Visualisierungen lassen sich Kodierung und Komplexität deutlich reduzieren. Das ermöglicht beispielsweise auch dem Marketing, Big Data-Analyselösungen auf den Features von MongoDB aufzubauen. Weil kein aufwändiger MapReduce-Code zu schreiben ist, sparen IT-Experten wegen der wegfallenden manuellen Programmierarbeiten ebenfalls viel Zeit.

Verknüpfung von Pentaho Data Integration (PDI) und MongoDB

Verknüpfung von Pentaho Data Integration (PDI) und MongoDB

OLAP-Auswertung mit dem Analyzer-Modul

Nachdem alle relevanten Daten und Kennzahlen in einem Mondrian-Schema hinterlegt und zu OLAP-Würfeln zusammengefasst sind, geht es an die Analyse. Hierfür verwendet Pentaho den Analyzer – ein Tool zur Auswertung und Visualisierung von Daten. Bis vor kurzem war der Pentaho Analyzer nur in Verbindung mit relationalen Datenbanksystemen einsetzbar. Doch mit Version 5.1 der Pentaho BA-Suite lassen sich Ad-Hoc-Analysen, Dashboards und Reports nun auch aus MongoBD erzeugen. Damit liefern Pentaho und MongoDB eine Rund-um-Unternehmensansicht und bieten kleinen wie großen Unternehmen die Möglichkeit, die Wertschöpfungspotentiale von Big Data voll zu nutzen.

Visualisierung schafft Wissen

MongoDB bietet eine effiziente und leistungsstarke Möglichkeit, besonders große und stark variierende Daten zu verwalten. Gerade durch die Techniken der In-Memory-Verarbeitung, der horizontalen Skalierung und dynamischer Schemata ist MongoDB sehr gut auf die Anforderungen und Einsatzszenarien im Big-Data-Bereich abgestimmt. Aber auch traditionelle Anwendungen lassen sich zuverlässig umsetzen, weshalb MongoDB im professionellen Unternehmenseinsatz verstärkt als Alternative zu relationalen Datenbanken genutzt wird.

[selectivetweet]#BI-Analysen der nächsten Generation – wir zeigen, was #MongoDB & #Pentaho leisten. #Data[/selectivetweet]

Mit der Pentaho BA-Suite lassen sich Berichte, Dashboards und Analysen direkt aus MongoDB erstellen und mit einer Vielzahl anderer Datenquellen zu interaktiven Visualisierungen kombinieren. Im Unternehmenseinsatz bringen beide Tools ihre individuellen Stärken in die Business Intelligence ein, sodass sich eine Vielzahl von Use Cases und Anwendungen abdecken lässt.