Datenintegration

Im Rahmen des Hauptseminars des Masterstudiengangs Angewandte Informatik ist unter der Leitung von Prof. Dr. Ines Rossak ein Lehrbuch zu den Grundlagen der Datenintegration entstanden. Das Buch behandelt typische Ansätze für die Informationsintegration, zeigt mögliche Problemfelder auf und beschreibt übliche Lösungsstategien. Außerdem wird an einem durchgängigen Beispielszenario Schritt für Schritt erklärt, wie Daten aus heterogenen Quellen mit der Open-Source-Software "Talend Open Studio for Data Integration" (TOSDI) integriert werden können.

Das Buch richtet sich nicht nur an Studentinnen und Studenten der Informatik, sondern an alle Personen, die die Grundlagen der Datenintegration und die praktische Arbeit mit Talend Open Studio erlernen wollen. Es ist im Carl Hanser Verlag unter der ISBN 978-3-446-43221-5 erschienen.

An dieser Stelle finden Sie Dateien, die Leserinnen und Lesern das Nachvollziehen aller Integrationsschritte am eigenen PC erlauben. Dies sind die drei verwendeten Datenbanken (inklusive Beispieldatensätzen) und das vollständige TOSDI-Projekt als Projektexport. Die Dateien sind als ZIP-Archiv verpackt und durch ein Passwort geschützt. Das Passwort ist das letzte Wort auf Seite 176 im Buch.

Step

Die Datenbanken liegen in der Datei als SQL-Skripte vor, die über das entsprechende Datenbankmanagementsystem ausgeführt werden können. Das TOSDI-Projekt ist als ZIP-Archiv enthalten, welches über den Startbildschirm von Talend Open Studio for Data Integration importiert werden kann. Bebilderte Anleitungen zur Installation und Konfiguration der Datenbanken und zum Import des Projektes in TOSDI finden Sie im Buch. Nachdem das Projekt importiert wurde, müssen die Verbindungsparameter zu den Datenbanken angepasst werden, da diese durch die Leserinnen und Leser festgelegt werden. Zur einfachen Handhabung sind alle Parameter in Kontexte ausgelagert, sodass die Anpassung an zentraler Stelle vorgenommen werden kann. Sie finden die Kontexte im "Repository" des Projektes. Die Änderung der Werte erfolgt durch Doppelklick auf einen Kontext und Veränderung der Parameter im Reiter "Werte als Tabelle".

Viel Spaß beim Lesen und Integrieren!