Wenn es darum geht, massiv viele Daten zu verarbeiten und das möglichst schnell, dann kommen schnell Systeme aus dem Hadoop-Umfeld und vor Allem Apache Spark zum Einsatz. In diesem Artikel erfährst du was der Unterschied zwischen MapReduce und der Spark DataFlow Engine sind, wie Spark grundsätzlich funktioniert und welche Möglichkeiten es mit Hilfe eingebauter Pakete bietet. Und das coole an Spark ist, dass es, wie auch Hadoop, eine freie Software ist. Viel Spaß beim Lesen!