Über diesen Kurs
61,040

100 % online

Beginnen Sie sofort und lernen Sie in Ihrem eigenen Tempo.

Flexible Fristen

Setzen Sie Fristen gemäß Ihrem Zeitplan zurück.

Ca. 15 Stunden zum Abschließen

Empfohlen: 6 hours/week...

Englisch

Untertitel: Englisch

Kompetenzen, die Sie erwerben

Scala ProgrammingBig DataApache SparkSQL

100 % online

Beginnen Sie sofort und lernen Sie in Ihrem eigenen Tempo.

Flexible Fristen

Setzen Sie Fristen gemäß Ihrem Zeitplan zurück.

Ca. 15 Stunden zum Abschließen

Empfohlen: 6 hours/week...

Englisch

Untertitel: Englisch

Lehrplan - Was Sie in diesem Kurs lernen werden

Woche
1
12 Stunden zum Abschließen

Getting Started + Spark Basics

Get up and running with Scala on your computer. Complete an example assignment to familiarize yourself with our unique way of submitting assignments. In this week, we'll bridge the gap between data parallelism in the shared memory scenario (learned in the Parallel Programming course, prerequisite) and the distributed scenario. We'll look at important concerns that arise in distributed systems, like latency and failure. We'll go on to cover the basics of Spark, a functionally-oriented framework for big data processing in Scala. We'll end the first week by exercising what we learned about Spark by immediately getting our hands dirty analyzing a real-world data set....
7 Videos (Gesamt 105 min), 5 Lektüren, 3 Quiz
7 Videos
Data-Parallel to Distributed Data-Parallel10m
Latency24m
RDDs, Spark's Distributed Collection9m
RDDs: Transformation and Actions16m
Evaluation in Spark: Unlike Scala Collections!20m
Cluster Topology Matters!8m
5 Lektüren
Tools setup10m
Eclipse tutorial10m
Intellij IDEA Tutorial10m
Sbt tutorial10m
Submitting solutions10m
Woche
2
7 Stunden zum Abschließen

Reduction Operations & Distributed Key-Value Pairs

This week, we'll look at a special kind of RDD called pair RDDs. With this specialized kind of RDD in hand, we'll cover essential operations on large data sets, such as reductions and joins....
4 Videos (Gesamt 59 min), 2 Quiz
4 Videos
Pair RDDs6m
Transformations and Actions on Pair RDDs20m
Joins17m
Woche
3
1 Stunde zum Abschließen

Partitioning and Shuffling

This week we'll look at some of the performance implications of using operations like joins. Is it possible to get the same result without having to pay for the overhead of moving data over the network? We'll answer this question by delving into how we can partition our data to achieve better data locality, in turn optimizing some of our Spark jobs....
4 Videos (Gesamt 57 min)
4 Videos
Partitioning14m
Optimizing with Partitioners11m
Wide vs Narrow Dependencies16m
Woche
4
8 Stunden zum Abschließen

Structured data: SQL, Dataframes, and Datasets

With our newfound understanding of the cost of data movement in a Spark job, and some experience optimizing jobs for data locality last week, this week we'll focus on how we can more easily achieve similar optimizations. Can structured data help us? We'll look at Spark SQL and its powerful optimizer which uses structure to apply impressive optimizations. We'll move on to cover DataFrames and Datasets, which give us a way to mix RDDs with the powerful automatic optimizations behind Spark SQL....
5 Videos (Gesamt 133 min), 2 Quiz
5 Videos
Spark SQL17m
DataFrames (1)26m
DataFrames (2)30m
Datasets43m
4.7
388 BewertungenChevron Right

14%

nahm einen neuen Beruf nach Abschluss dieser Kurse auf

18%

ziehen Sie für Ihren Beruf greifbaren Nutzen aus diesem Kurs

13%

erhalten Sie eine Gehaltserhöhung oder Beförderung

Top-Bewertungen

von CCJun 8th 2017

The sessions where clearly explained and focused. Some of the exercises contained slightly confusing hints and information, but I'm sure those mistakes will be ironed out in future iterations. Thanks!

von CRApr 10th 2017

Great introduction to spark. Fun assignments. Since it was the first ever session, there were quite a few kinks with the assignments. But the discussion forums rescued me any time I was stuck.

Dozent

Avatar

Prof. Heather Miller

Assistant Professor
Carnegie Mellon University

Über École Polytechnique Fédérale de Lausanne

Über die Spezialisierung Functional Programming in Scala

Discover how to write elegant code that works the first time it is run. This Specialization provides a hands-on introduction to functional programming using the widespread programming language, Scala. It begins from the basic building blocks of the functional paradigm, first showing how to use these blocks to solve small problems, before building up to combining these concepts to architect larger functional programs. You'll see how the functional paradigm facilitates parallel and distributed programming, and through a series of hands on examples and programming assignments, you'll learn how to analyze data sets small to large; from parallel programming on multicore architectures, to distributed programming on a cluster using Apache Spark. A final capstone project will allow you to apply the skills you learned by building a large data-intensive application using real-world data....
Functional Programming in Scala

Häufig gestellte Fragen

  • Sobald Sie sich für ein Zertifikat angemeldet haben, haben Sie Zugriff auf alle Videos, Quizspiele und Programmieraufgaben (falls zutreffend). Aufgaben, die von anderen Kursteilnehmern bewertet werden, können erst dann eingereicht und überprüft werden, wenn Ihr Unterricht begonnen hat. Wenn Sie sich den Kurs anschauen möchten, ohne ihn zu kaufen, können Sie womöglich auf bestimmte Aufgaben nicht zugreifen.

  • Wenn Sie sich für den Kurs anmelden, erhalten Sie Zugriff auf alle Kurse der Spezialisierung und Sie erhalten nach Abschluss aller Arbeiten ein Zertifikat. Ihr elektronisches Zertifikat wird zu Ihrer Seite „Errungenschaften“ hinzugefügt – von dort können Sie Ihr Zertifikat ausdrucken oder es zu Ihrem LinkedIn Profil hinzufügen. Wenn Sie nur lesen und den Inhalt des Kurses anzeigen möchten, können Sie kostenlos als Gast an dem Kurs teilnehmen.

Haben Sie weitere Fragen? Besuchen Sie das Hilfe-Center für Teiln..