Manipulating big data distributed over a cluster using functional concepts is rampant in industry, and is arguably one of the first widespread industrial uses of functional ideas. This is evidenced by the popularity of MapReduce and Hadoop, and most recently Apache Spark, a fast, in-memory distributed collections framework written in Scala. In this course, we'll see how the data parallel paradigm can be extended to the distributed case, using Spark throughout. We'll cover Spark's programming model in detail, being careful to understand how and when it differs from familiar programming models, like shared-memory parallel collections or sequential Scala collections. Through hands-on examples in Spark and Scala, we'll learn when important issues related to distribution like latency and network communication should be considered and how they can be addressed effectively for improved performance.

Big Data Analysis with Scala and Spark (Scala 2 version)
École Polytechnique Fédérale de LausanneÜber diesen Kurs
3.314 kürzliche Aufrufe
Flexible Fristen
Setzen Sie Fristen gemäß Ihrem Zeitplan zurück.
Zertifikat zur Vorlage
Erhalten Sie nach Abschluss ein Zertifikat
100 % online
Beginnen Sie sofort und lernen Sie in Ihrem eigenen Tempo.
Stufe „Mittel“
Ca. 28 Stunden zum Abschließen
Englisch
Könnte Ihr Unternehmen von Mitarbeiterweiterbildungen für gefragte Kompetenzen profitieren?
Probieren Sie Coursera for Business ausKompetenzen, die Sie erwerben
- Scala Programming
- Big Data
- Apache Spark
- SQL
Flexible Fristen
Setzen Sie Fristen gemäß Ihrem Zeitplan zurück.
Zertifikat zur Vorlage
Erhalten Sie nach Abschluss ein Zertifikat
100 % online
Beginnen Sie sofort und lernen Sie in Ihrem eigenen Tempo.
Stufe „Mittel“
Ca. 28 Stunden zum Abschließen
Englisch
Könnte Ihr Unternehmen von Mitarbeiterweiterbildungen für gefragte Kompetenzen profitieren?
Probieren Sie Coursera for Business ausLehrplan - Was Sie in diesem Kurs lernen werden
12 Stunden zum Abschließen
Getting Started + Spark Basics
12 Stunden zum Abschließen
7 Videos (Gesamt 105 min), 6 Lektüren, 3 Quiz
7 Stunden zum Abschließen
Reduction Operations & Distributed Key-Value Pairs
7 Stunden zum Abschließen
4 Videos (Gesamt 59 min)
1 Stunde zum Abschließen
Partitioning and Shuffling
1 Stunde zum Abschließen
4 Videos (Gesamt 57 min)
8 Stunden zum Abschließen
Structured data: SQL, Dataframes, and Datasets
8 Stunden zum Abschließen
5 Videos (Gesamt 133 min)
Häufig gestellte Fragen
Wann erhalte ich Zugang zu den Vorträgen und Aufgaben?
Was bekomme ich, wenn ich das Zertifikat erwerbe?
Ist finanzielle Unterstützung möglich?
Haben Sie weitere Fragen? Besuchen Sie das Learner Help Center.