Pentaho, auch bekannt als Kettle, ist eine Software mit grafischer Oberfläche zum visuellen gestalten von Prozessabläufen für die Datentransformation.
Per Drag & Drop lassen sich so verschiedene Prozessabläufe aufbauen die Daten laden, transformieren und wieder ablegen können. Im Bereich eines Data-Warehouses kann man auch ETL-Prozesskette dazu sagen. Die drei Buchstaben ETL stehen dabei für die Begriffe Extrahieren, Transformieren und Laden. Dies ist ein bestimmter Prozess in einem Data-Warehouse und sorgt dafür das Daten aus unterschiedlichsten Quellen integriert werden können.
Die Pentaho Software gibt es als große Enterprise Version und in einer abgespeckten Form als Community Edition die kostenlos zur Verfügung gestellt wird unter einer Open Source Lizenz.
Zugriff auf MySQL Datenbanken mit Pentaho
Für den Zugriff auf MySQL Datenbanken benötigt man den MySQL Connector J. Den MySQL Connector J kann man sich auf der MySQL Webseite heruntergeladen um ganz einfach in Pentaho einbinden. Durch den Connector hat man dann auch zugriff auf MySQL Datenbanken um von dort Daten einzulesen oder auch ablegen zu können.
Für Windows Betriebssysteme lädt man am besten die Plattformunabhängige Variante herunter die als ZIP-Datei bereitgestellt wird. Nach dem herunterladen muss man das Archiv nur noch entpacken und die darin enthaltende .jar
Datei in das lib
Verzeichnis von Pentaho kopieren.
Weblinks
- Projektseite von der Pentaho Community Edition
- Pentaho auf sourceforge.net herunterladen
- MySQL Connector J Downloadseite