Alternative Ansätze für ETL Prozesse

Was

Mit MAP & REDUCE zu mehr Erfolg bei großen Datenmengen.

Evtl. könnte ich das mal an piwik, oder den umija LogFiles ausprobieren.

dis * klml>edma bei piwik? geht das cool, weil an sich sind das ja flatdates. sollen wa das mal mit mongoDB probieren? ist afaik für große mengen performanter als couchDB (was ich für Anwendungen recht schick finde;) http://lists.piwik.org/pipermail/piwik-hackers/2010-February/000833.html

Notes

*Hadoop als Google's Map & Reduce Ansatz * Hive als DWH Infrastruktur * Pentaho hat jetzt auch Hadoop integriert... * Nutch on existing hadoop * weitere BigData Seite auf umija ...