Das wirst du lernen in diesem Kurs
- Verwende Python mit Spark um Big Data zu analysieren
- Lerne, wie Du die neue Spark 2.0 DataFrame-Syntax verwenden
- Arbeite zudem an Consulting-Projekten, die reale Situationen nachahmen
- Wir schauen uns an wie man Kundenabwanderung mit Logistischer Regression klassifizieren kann
- Weiter verwenden wir Spark mit Entscheidungsbäumen für die Klassifizierung
- Zudem wirst du lernen, wie Sparks Gradient Boosted Trees verwendet wird
- Verwende außerdem MLlib von Spark, um leistungsstarke Machine Learning-Modelle zu erstellen
- Wir richten dann Amazon Web Services EC2 für Big Data-Analyse ein
- Erfahren, wie du AWS Elastic MapReduce Service verwenden kannst
- Erstelle außerdem einen Spam-Filter mit Spark und Natural Language Processing
- Verwende anschließend Spark Streaming, um Tweets in Echtzeit zu analysieren
Anforderungen
- Allgemeine Programmierkenntnisse in jeder Sprache (vorzugsweise Python)
- 20 GB freier Speicherplatz auf deinem lokalen Computer (oder alternativ eine starke Internetverbindung für AWS)
Jetzt Spark und Python für Big Data und Data Science mit PySpark belegen
Erfahrungsberichte
4.3
Dozentenbewertung
1.282+ Teilnehmer
Udemy
“Der Kurs hat ein sehr gutes Level und als Anfänger in Big Data komme ich sehr gut mit. Der Kursleiter erklärt alles sehr genau und man kann ihm sehr gut folgen.”
Kursbeschreibung
Jetzt Spark und Python für Big Data und Data Science mit PySpark belegen