Blog - Software Developer: David Thol

Artikel mit dem Tag "Large-scale"

Data Science · 02. Februar 2018

Grundlagen von Apache Spark

Wenn es darum geht, massiv viele Daten zu verarbeiten und das möglichst schnell, dann kommen schnell Systeme aus dem Hadoop-Umfeld und vor Allem Apache Spark zum Einsatz. In diesem Artikel erfährst du was der Unterschied zwischen MapReduce und der Spark DataFlow Engine sind, wie Spark grundsätzlich funktioniert und welche Möglichkeiten es mit Hilfe eingebauter Pakete bietet. Und das coole an Spark ist, dass es, wie auch Hadoop, eine freie Software ist. Viel Spaß beim Lesen!

Data Science · 26. Januar 2018

Was ist eigentlich Hadoop?

Apache Hadoop gewann in den letzten Jahren stark an Popularität. Hadoop als Ökosystem für mehrere Anwendungen im Bereich Big Data, ermöglicht die Verarbeitung massiv vieler Daten. Damit bietet es die Grundlage für Analysen, aber auch für neue Möglichkeiten der künstlichen Intelligenz und im Bereich des Internets der Dinge (zu engl. Internet of Things). Hinzu kommt das Hadoop unter der Apache Lizenz steht und somit freie Software ist.