Tutorial
Mit Google automatisch twittern
18. Jan
Twitter spielt eine zunehmend größere Rolle im Word Wide Web. Der Erfolg des Mircoblogging-Dienstes ist einfach enorm. Tweets, also die 140 Zeichen langen Nachrichten, werden tausendfach jede Sekunde geschrieben und gelesen. Es ist kaum leichter, auf so einfache Art und Weise soviele Menschen anzusprechen. Es gibt bereits erste Werbe-Netze wie be-a-magpie.com, die es einem erlauben Mehr >
Google Wave – Suche mit Operatoren
19. Nov
Mit Google Wave suchen ist ganz leicht, wenn man die verschiedenen Möglichkeiten kennt. Prinzipiell funktioniert die Suche wie auch bei der normalen Google-Websuche. Man kann einzelne Begriffe suchen, in dem man diese im Suchfeld der Reihe nach auflistet. Möchte man, dass ein Suchbegriff NICHT in den Treffern auftaucht, dann stellt man ein Minus davor.
Generell scheint Mehr >
tFileFetch: HTTP-Zugriff in Talend Jobs
18. Nov
Mit tFileFetch kann man in seinen ETL-Prozessen auf beliebige HTTP-Server zugreifen, entweder um Dateien herunterzuladen, oder Daten zu übermitteln. Auch der Upload von Dateien ist dabei möglich. Ausserdem bietet tFileFetch auch den lesenden Zugriff auf Dateien auf einem FTP- sowie auf einem Samba (SMB)-Server. FTP und SMB-Zugriff werde ich jedoch in diesem Beitrag außenvorlassen.
Die Komponente Mehr >
tServerAlive: Lebt denn der Server noch?
16. Nov
Beim Design von Datenintegrationsprozessen macht man sich oftmals viele Gedanken im Vorfeld. So werden Schwächen in der Datenqualität meist schon vorab ermittelt (z.B. mit Talend Open Profiler) und dann im ETL-Prozess eine entsprechende Optimierung umgesetzt.
Auch zur Laufzeit auftretende Fehler, wie der Klassiker, die NullPointer-Exception werden bereits berücksichtigt und z.B. mit tSchemaComplianceCheck verhindert. Aber eine Prüfung Mehr >
Öffentliche Google-Waves
12. Nov
Mir war bisweilen gar nicht bewusst, dass man Google-Waves auch öffentlich machen kann. Dabei geht das eigentlich relativ einfach, auch wenn einem das Googlewave-Webinterface da in keinster Weise entgegenkommt. Hier muss Google noch ein wenig nachlegen.
Wenn man aber in der Searchbox with:public eingibt, dann listet GWave alle öffentlichen Waves auf. Will man nur deutschsprachige Waves Mehr >
tApacheLogInput: Apache Logfiles in TOS einlesen
12. Nov
Der einfachste Weg, um standardformatierte Log-Files des Apache HTTP-Servers in einem Talend-Job einzulesen, ist es die Komponenten tApacheLogInput zu verwenden.
tApacheLogInput geht davon aus, dass das Logfile in dem Format vorliegt, in welchem Apache HTTP es standardmäßig erzeugt. Sobald man an der Konfiguration der Logfile-Generierung seitens Apaches Änderungen vornimmt, ist die Kompontene tApacheLogInput nicht mehr zu Mehr >
Talend Open Studio: Syntax-Fehler schon während des Designs erkennen
29. Okt
Wer viel mit Talend Open Studio oder der Talend Integration Suite arbeitet, wird sich sicherlich manchmal darüber ärgern, dass der ein oder andere syntaktische Fehler beim Parametrisieren der Komponenten erst beim „Ausführen“ bzw. dem zuvor durchgeführten Kompiliervorgang als solcher erkannt wird.
Hier zeige ich einen Ausweg aus dieser Situation auf.
Einführung zu Talend Open Studio
30. Apr
Markus Klimaschewski hat im Entwicklerforum eine bebilderte Dokumentation zu Talend Open Studio verfasst.
Er zeigt darin die ersten Schritte mit TOS anhand vieler Screenshots auf und erklärt grundlegende Funktionen, wenn auch relativ knappgehalten. Aber sicherlich hat sich seine Mühe gelohnt, wenn er damit dem ein oder anderen helfen kann, die ersten Gehversuche mit Talend Open Studio Mehr >
Tutorial: Eigene Talend-Komponenten entwickeln (Teil 1)
17. Mrz
Es gibt zwei Möglichkeiten, eigene Komponenten für Talend Open Studio bzw. Talend Integration Suite zu entwickeln.
Die erste – dass ist die, welche ich bisher selbst angewandt hatte – sieht wie folgt aus:
Man legt innerhalb des Talend-Verzeichnisses, im Ordner plugins\org.talend.designer.components.localprovider_3.0.3.r21383\components ein weiteres Verzeichnis an und platziert darin alle notwendigen Dateien (*jet, *xml, etc.). Um seine Komponente Mehr >
