Archiv für den Monat: Mai 2013

BIG DATA

 

Der Autor Pavlo Baron schreibt über sich selbst:

In 20 Jahren meines IT-Lebens habe ich so einiges gesehen und erlebt, worüber es sich lohnt, zu schreiben. Zum Teil auch Dinge, über die es sich lohnt, zu schmunzeln. Aber auch solche, über die es sich lohnt, zu lachen. Und wenn ich über etwas schreibe, so möchte ich, dass es mindestens mit einem Lächeln gelesen wird. Stellenweise mit einem Grinsen. In einigem Fällen sogar mit lautem Lachen.

Technische Bücher können trocken und langweilig sein. Sind sie meistens auch. Es gibt keinen Grund, warum ich die Anzahl solcher Bücher erhöhen sollte, nur weil ein Baum bereits sterben musste und ein leeres Blatt Papier einsam und unvollständig aussieht.

Das Buch BIG DATA besteht aus 5 Kapiteln die sich in

  1. Management Summary
  2. Was?
  3. Wie?
  4. Womit?
  5. Way Forward

aufteilen.

Im ersten Kapitel wird beschrieben, um was es sich bei BIG DATA eigentlich handelt und wie man damit umgeht.

Schön finde ich den Satz: BIG DATA ermöglicht es den Menschen mit höherer fachlicher Kompetenz, Entscheidungen so einfach und qualifiziert wie möglich zu treffen.

Und dies, obwohl der Autor den Begriff “Big Data” für unsinnig hält, ihn aber in Anführungsstrichen im gesamten Buch verwendet. Er konzentriert sich mehr auch die Inhalte, die sich hinter dem Begriff verbergen.

Anhand der Fragestellungen Was? Wie? Womit? beschreibt der Autor, wie Daten gewonnen werden können, was in den Daten als Information enthalten ist, wie sich diese Informationen aus der analytischen/wissenschaftlichen Perspektive gewinnen lassen und Womit, also mit welchen Werkzeugen sich dies bewerkstelligen lässt.

Diese kurze Zusammenfassung wird dem Inhalt des Buchs sicherlich nicht gerecht, in dem der Autor manchmal recht sarkastisch bestimmte Zustände und Vorgehensweisen beschreibt.

Aufgeräumt wird auch mit Schubladendenken, das nur in Schwarz und Weiß unterscheidet. Dies geschieht unter anderem am Beispiel der der Vs Volume, Velocity und Variety, allerdings nur eine kurze Episode.

Des Weiteren werden falschen Fragestellungen, wie sie in Kommentaren oder Kolumnen zu lesen sind, richtig gestellt und entsprechend beantwortet.

Informativ sind auch die kleinen Abschweifungen, die auf interessante Aspekte aufmerksam machen, ohne dass damit die rote Linie verlassen wird. Hierzu zählen auch die lesenswerten, eingestreuten Links.

Das Wie? bedeutet  Extraktion von Informationen aus Daten, also eine wissenschaftliche, keine akademische Aufgabe. Auf über 70 Seiten wird das Wie? beschrieben und auch hier mit falschen Fragestellungen aufgeräumt.

Wichtiger ist aber hier, konkrete Handlungsanweisungen zu erhalten. Dazu zählt beispielsweise, dass die einzige sinnvolle Investition die in Ihre Mitarbeiter ist.

Sie erfahren, was “Big Data-Schmerzen” sind und wie sie erzeugt werden. Beleuchtet wird auch die IT-Strategie im Big Data-Licht. In einem weiteren Unterkapitel wird die datenzentrierte Arbeit behandelt, zu der auch die Unterscheidung bei der Bearbeitung der Daten zwischen schnell und gleich zählt. Es weiteres Unterkapitel behandelt die richtige Benutzung der IT-Instrumente.

Besonders interessant finde ich das Unterkapitel Big Data-Perspektiven, bei dem es um die Speicherung großer Datenmengen, deren Aufbereitung und ihre Bereitstellung geht. Außerdem wird die Analyse großer Daten in Echtzeit angesprochen und zuletzt deren Visualisierung.

Abgeschlossen wird das Wie? mit  Anmerkungen des Autors zum Thema Datenschutz und Datensicherheit.

Auf weiteren 80 Seiten wird das Womit? behandelt. Der ganze Zoo der Big Data-Technologien, wie der Autor dies nennt, wird hiervorgestellt. Nach der Behandlung der theoretischen Grundlagen werden alte und neue Technologien beleuchtet, RDBMS, NoSQL, NewSQL In-Memory und wie sie alle heißen.

Ein Thema sind auch die Programmiersprachen. Reicht eine aus und wenn Nein, welche Sprache eignet sich wofür?

Spannend ist auch die Fragestellung: Was geschieht mit meinen aktuellen Errungenschaften?

Das fünfte und letzte Kapitel beschäftigt sich mit den aktuellen Trends, dem Start mit Big Data, die sich ergebenden finanziellen Aspekte und der Frage: Wo und wie kann ich mich weiter informieren?

Den einzigen Schwachpunkt in diesem sonst wirklich ausgezeichneten Buch sehe ich in dem etwas schmalbrüstigen Stichwortverzeichnis. Hier hätte der Autor etwas mehr investieren können.

Lesen sollten dieses Buch meiner Meinung nach nicht nur IT-Entscheider, sondern alle, die sich beruflich mit Daten beschäftigen müssen. Wollen Sie sich wirklich mit dem Thema Big Data ausführlich beschäftigen, dann haben Sie hier eine Lektüre vorliegen, die anspruchsvoll ist aber auch sehr informativ. Interessant ist aber auch der aufgelockerte Schreibstil, der einem das eine oder andere Mal ein Lächeln auf die Lippen zaubert.

 Erschienen ist das Buch übrigens im Hanser Verlag