Alternative Ansätze für ETL Prozesse
Was
Mit MAP & REDUCE zu mehr Erfolg bei großen Datenmengen.
Evtl. könnte ich das mal an piwik, oder den umija LogFiles ausprobieren.
dis * klml>edma bei piwik? geht das cool, weil an sich sind das ja flatdates. sollen wa das mal mit mongoDB probieren? ist afaik für große mengen performanter als couchDB (was ich für Anwendungen recht schick finde;) http://lists.piwik.org/pipermail/piwik-hackers/2010-February/000833.html
Notes
*Hadoop als Google's Map & Reduce Ansatz * Hive als DWH Infrastruktur * Pentaho hat jetzt auch Hadoop integriert... * Nutch on existing hadoop * weitere BigData Seite auf umija ...