Mit der Veröffentlichung von Talend Open Studio for Big Data wird Apache Hadoop für jeden leicht nutzbar.
Dieses Open Studio konzentriert sich auf die üblichen Aufgaben der Datenintegration und die Anbindung an ein Hadoop-Cluster. Es sind die Konnektoren für HDFS-Zugriff, HBase-Datenbank, Hive, PigLatin sowie Sqoop enthalten.
Damit lassen sich Daten ganz einfach aus Textdateien, Message-Queues, Datenbanken und vielen anderen Quellen in das Hadoop Distributed File System schreiben. Und natürlich auch wieder daraus extrahieren.

TOS Beispiel-Job mit PigLatin-Komponenten
Mit HiveQL kann man umfangreiche Datensammlungen aggregieren und die kompakten Ergebnisse zum Beispiel in ein Excel-Sheet schreiben.
Mit den PigLatin-Komponenten können einige Standard-Tasks, wie z.B. Joins, Record-Filterung, usw., aus dem Baukasten heraus genutzt werden.
Talend Open Studio for Big Data unterliegt der Apache-Lizenz und kann kostenlos von folgendem Link heruntergeladen werden:


