Big Data: Die Potentiale von Daten verstehen, Projekte daraus verwirklichen und seine Daten entfalten.

Amazon ergänzt seit einigen Jahren seine Geschäftsfelder im Bereich Big Data Dienstleistungen. In Berlin wurde dafür das Amazon Development Center für Mashine Learning eröffnet. Dort sollen nicht nur neue Services für externe Kunden weiterentwickelt werden, sondern auch ein Ort für Zusammenarbeit entstehen. E-Book-Autoren treffen auf Entwickler, Entwickler auf die Startup-Szene. Der Dircetor of Machine Learning Science, Dr. Ralf Herbrich, hat sich für unsere Fragen Zeit genommen.

[highlight_area classes=“brand“ headline=““ button=“This Interview is also available in English“ button_link=“https://bigdatablog.de/2015/10/15/machine-learning-an-interview-about-the-future-of-big-data/“ button_target=“_blank“ icon=“false“][/highlight_area]

Herr Herbrich, in Berlin gibt es bereits seit 2013 Amazon Web Services, worüber Big-Data-Dienstleistungen wie die Stimmungsanalyse durch die Auswertung von Twitter-Mitteilungen genutzt werden können. Wie unterscheiden sich davon die Dienstleistungen, die Sie im neuen Amazon Entwicklungszentrum anbieten?

Amazon arbeitet beständig an Innovationen für seinen Kunden. Das Berlin Development Center ist dafür ein großartiges Beispiel. Im Berliner Development Center arbeiten wir an der Entwicklung der nächsten Gerneration von Amazons Technologien mit dem Fokus auf Machine Learning und Verteilten Systemen. Das Development Center ist eigentlich auch schon seit 2013 in Berlin und war zunächst in einem temporären Büro in Berlin Charlottenburg, bis wir im Juni 2015 in die Krausenhöfe in unser neues Büro eingezogen sind.

Neben anderen Teams, bietet das Büro inzwischen auch Amazon Web Services (AWS), dem AWS OpsWork Team und dem Amazon Machine Learning Team eine Heimat. Einige der Technologien, die von diesen Teams entwickelt werden, sind bereits live und für die Kunden verfügbar wie beispielsweise Amazon Machine Learning und AWS Ops Works. All diese Technologien ermöglichen es, unseren Kunden neue Möglichkeiten zu bieten – seien das die neuen Features für AWS oder die internen Möglichkeiten, die es uns erlauben, die Amazon Pakete noch schneller an die Amazon Einzelhandelskunden zu liefern.

[pullquote orientation=“left“]

Dr. Ralf Herbrich ist Dircetor of Machine Learning Science bei Amazon.

Dr. Ralf Herbrich ist Dircetor of Machine Learning Science bei Amazon.

[/pullquote]

Die Methoden von Predictive Analytics erlauben es, Muster zu erkennen und die Wahrscheinlichkeit zukünftiger Ereignisse vorherzusagen. Damit können beispielsweise modische Trends frühzeitig erkannt werden. Ist es auch möglich, den persönlichen Geschmack der Kunden zu erkennen und bei Angeboten zu berücksichtigen?

Die Methoden von Machine Learning oder Predictive Analytics erlauben es beide, Muster in Daten zu erkennen. Solche Muster beinhalten Abhängigkeiten zwischen Feldern von Daten oder Gesetzmäßigkeiten, die Felder von Daten mit hoher Genauigkeit reproduzieren. Zum Beispiel die Neigung ein Produkt zu kaufen, je nachdem welche Farbe, welche Textur oder welche Marke ein Modeprodukt hat. Wenn man diese Methoden von Predictive Analytic auf Daten auf Kundenebene anwendet, kann man Aussagen zum persönlichen Stil ableiten und für personalisierte Produktempfehlungen nutzen. Wenn dies der Fall ist, senden wir regelmäßig Stil-Empfehlungen an Kunden.

Hat der neue Standort des Amazon-Entwicklungszentrums in den Krausenhöfen inmitten des Verlags-Zentrums der Stadt auch eine symbolische Bedeutung? Konzentriert sich Amazon stärker auf das Verlagsgeschäft, oder richten sich die Angebote an Kunden aus allen Bereichen?

Im Berlin Development Center arbeiten wir an der nächsten Generation von Technologien für Amazon mit dem Fokus auf Machine Learning und verteilte Systeme. Das Machine Learning Team entwickelt Lösungen für Amazon, die vom Einzelhandel (Verkäufer, Einzelhandelskunden, Auftragsabwicklung) über Amazon Web Services bis hin zu digitalen Medien und Geräten reicht – die Dienstleitungen, die das Team im Berlin Development Center erarbeitet, sind also für alle Kunden von Amazon.

Im neu eröffneten Amazon-Entwicklungszentrum in Berlin sollen auch E-Book-Autoren zur Verbesserung des Angebots von Amazon beitragen. Wie läuft die Zusammenarbeit zwischen Autoren und Entwicklern? Gibt es hier keine Verständigungsschwierigkeiten?

Gleichzeitig mit der Eröffnung des Büros in Berlin im Juni diesen Jahres fand eine erste Amazon Academy statt, die Autoren, Verkäufer, Entwickler und Wissenschaftler für einen ganzen Tag zusammengebracht hat. Das Ziel des Tages war, Probleme und Ideen miteinander auszutauschen. Die Aktion wurde von unseren Kunden sehr gut aufgenommen und wir werden an diesem Format weiter festhalten, um die Kommunikation zwischen Autoren und Entwicklern leichter zu machen. Wir planen derzeit die nächste Amazon Academy und werden Datum und Ort in den nächsten Monaten bekanntgeben.

[selectivetweet]Das @Amazon Development Center Berlin: Ein Gespräch über die Zukunft von #BigData. #MachineLearning[/selectivetweet]

Einer ihrer Schwerpunkte ist dabei Machine Learning. Wie funktioniert Machine Learning allgemein und wie sind die Ergebnisse im Bezug auf Textverarbeitung anwendbar?

Machine Learning ist die Wissenschaft, um Muster in Daten zu erkennen und diese für akkurate Vorhersagen und optimierte Handlungen zu nutzen – in vielerlei Hinsicht ist es die „Wissenschaft von Big Data”. Die Methoden von Machine Learning sind im Grunde Such-Methoden in einer Menge von Regeln, mit denen Daten unterlegt werden können – ein Suchkriterium bestimmt die Genauigkeit, mit der die Regeln die aufgezeichneten Daten beschreiben. Bei der Analyse von Text-Daten werden für das Machine Learning Regeln verwendet, deren Grundbausteine Worte sind. Oft wird zunächst versucht, vorherzusagen, um welchen Teil von Sprache es sich bei einem jeweiligen Wort gerade handelt (Verb, Nomen, nominal Phrase). Dann wird diese Vorhersage genutzt, um eine weitere Aussage bezüglich eines darüber liegenden Bedeutungslevels zu treffen – wie beispielsweise über Stimmungen.

Was sind die Grenzen beim Mashine Learning im Bezug auf Textverarbeitung? Ist es beispielsweise möglich, so etwas wie Ironie in Texten zu berücksichtigen, wenn es etwa um Kundenfeedback geht?

Ironie in Texten zu erkennen ist im Prinzip möglich. Allerdings gibt es dabei zwei Schwierigkeiten: Erstens ist Ironie etwas sehr subjektives und die Methoden von Machine Learning können nur so gut sein, wie die zugrundeliegenden Trainingsdaten. Wenn zwei Menschen mit vollständig verschiedenem Sinn für Ironie die Grundlage für ein Machine Learning System liefern, wird es nicht in der Lage sein, Ironie gut zu erkennen – mit einer Ausnahme: die Identität der Person, die die Vorlage geliefert hat, ist bekannt. Dann lässt sich eine Regel für diese Person erlernen. Zweitens müssten Machine Learning Methoden über ein Textverständnis verfügen, bei dem klar ist, welche Einheiten aufeinander bezogen sind. Das Problem der Analyse von Zusammenhängen und dem Erkennen von klassifizierten Einheiten ist im Moment eine der größten Herausforderungen für Machine Learning Methoden für Texte.

Im neuen Amazon Development Center werden auch Startups gefördert. In welcher Form findet diese Förderung statt? Geht es hier auch hauptsächlich um Geschäftsideen aus dem Bereich Machine Learning?

AWS hat in Berlin Startups unterstützt seit wir vor neun Jahren das Unternehmen gründeten. Startups, die in Deutschland etwas mit Cloud Computing machen, können ein Programm, das AWS Activate heißt, kostenlos verwenden. AWS Activate ist dafür designed, Startups mit Ressourcen zu versorgen, um erst einmal anzufangen. Sie haben freien Zugang zu technischen Trainings, freien technischen Support und 1:1-Hilfe von Professionals. Es beinhaltet auch den kostenlosen Zugang zu AWS Free Tier mit kostenloser Nutzung von Ressourcen, die es Startups ermöglichen, ohne Kostenaufwand ihre Idee umzusetzen. Wer mehr Informationen möchte, dem empfehle ich den Besuch unserer AWS Activate-Seite.

Zusätzlich werden wir im Oktober im fünften Stock unseres Berliner Büros ein AWS Pop-up Loft eröffnen. Im Pop-up Loft finden Startups einen Ort, an dem sie mit AWS-Mitarbeitern direkt in Kontakt treten können. Hier gibt es 1:1-Hilfestellung von Softwarelösungs-Architekten, man kann an Technik-Bootcamps und Trainings teilnehmen oder direkt Kontakt mit den AWS-Mitarbeitern und Partnern aufnehmen. Es wird eines von nur zwei Pop-up-Lofts in Europa sein und wir laden alle herzlich ein, die etwas über die Cloud lernen, oder ein eigenes Unternehmen starten möchten.

Im Dezember 2012 haben wir auch ein ein Machine Learning Forschungsprogramm ins Leben gerufen. Dort fördern wir neue Anwendungen im Bereich Machine Learning im Cloud Maßstab. Wir laden Forscher von überall her ein, sich zu bewerben.

Herzlichen Dank für das Interview.