Über diesen Kurs
15,739 kürzliche Aufrufe

100 % online

Beginnen Sie sofort und lernen Sie in Ihrem eigenen Tempo.

Flexible Fristen

Setzen Sie Fristen gemäß Ihrem Zeitplan zurück.

Stufe „Mittel“

Ca. 16 Stunden zum Abschließen

Empfohlen: 4 weeks of study, 2-5 hours/week...

Englisch

Untertitel: Englisch

Was Sie lernen werden

  • Check

    U​se the collaborative Databricks workspace and write SQL code that executes against a cluster of machines

  • Check

    Use Spark UI to analyze performance and identify bottlenecks

  • Check

    Create an end-to-end pipeline that reads data, transforms it, and saves the result

  • Check

    B​uild a linear regression model and make predictions using SparkSQL

Kompetenzen, die Sie erwerben

Data ScienceApache SparkSQL

100 % online

Beginnen Sie sofort und lernen Sie in Ihrem eigenen Tempo.

Flexible Fristen

Setzen Sie Fristen gemäß Ihrem Zeitplan zurück.

Stufe „Mittel“

Ca. 16 Stunden zum Abschließen

Empfohlen: 4 weeks of study, 2-5 hours/week...

Englisch

Untertitel: Englisch

Lehrplan - Was Sie in diesem Kurs lernen werden

Woche
1
3 Stunden zum Abschließen

Introduction to Spark

6 Videos (Gesamt 32 min), 3 Lektüren, 2 Quiz
6 Videos
Why Distributed Computing?7m
Spark DataFrames6m
The Databricks Environment8m
SQL in Notebooks3m
Import Data2m
3 Lektüren
A Note From UC Davis10m
Readings and Resources40m
Assignment #1 - Queries in Spark SQL30m
2 praktische Übungen
Assignment #1 Quiz - Queries in Spark SQL30m
Module 1 Quiz30m
Woche
2
2 Stunden zum Abschließen

Spark Core Concepts

6 Videos (Gesamt 25 min), 2 Lektüren, 2 Quiz
6 Videos
Spark Terminology3m
Caching5m
Shuffle Partitions7m
Spark UI3m
Broadcast Joins3m
2 Lektüren
Readings30m
Assignment #2 - Spark Internals30m
2 praktische Übungen
Assignment #2 Quiz - Spark Internals30m
Module 2 Quiz30m
Woche
3
3 Stunden zum Abschließen

Engineering Data Pipelines

7 Videos (Gesamt 43 min), 2 Lektüren, 2 Quiz
7 Videos
Spark as a Connector6m
Accessing Data10m
File Formats8m
Schemas and Types4m
Writing Data6m
Managed and Unmanaged Tables4m
2 Lektüren
Readings20m
Assignment #3 - Engineering Data Pipelines30m
2 praktische Übungen
Assignment #3 Quiz - Engineering Data Pipelines30m
Module 3 Quiz30m
Woche
4
4 Stunden zum Abschließen

Machine Learning Applications of Spark

7 Videos (Gesamt 35 min), 2 Lektüren, 3 Quiz
7 Videos
Applications of Machine Learning4m
Machine Learning Fundamentals6m
Linear Regression6m
Training Linear Regression Model8m
Applying Machine Learning with UDFs4m
Course Summary3m
2 Lektüren
Readings20m
Assignment #4 - Logistic Regression Classifier10m
2 praktische Übungen
Assignment #4 Quiz - Logistic Regression Classifier30m
Module 4 Quiz30m
4.5
2 Bewertungen

Top-Bewertungen von Distributed Computing with Spark SQL

von JBJan 6th 2020

Extremely informative for those who are seeking to learn the fundamentals for distributed computing using Spark SQL.

Dozenten

Bild des Dozenten, Brooke Wenig

Brooke Wenig

Machine Learning Practice Lead at Databricks
Continuing and Professional Education
Bild des Dozenten, Conor Murphy

Conor Murphy

Data Scientist at Databricks
Continuing and Professional Education

Über University of California, Davis

UC Davis, one of the nation’s top-ranked research universities, is a global leader in agriculture, veterinary medicine, sustainability, environmental and biological sciences, and technology. With four colleges and six professional schools, UC Davis and its students and alumni are known for their academic excellence, meaningful public service and profound international impact....

Über den Spezialisierung Learn SQL Basics for Data Science

This Specialization is intended for a learner with no previous coding experience seeking to develop SQL query fluency. Through four progressively more difficult SQL projects with data science applications, you will cover topics such as SQL basics, data wrangling, SQL analysis, AB testing, distributed computing using Apache Spark, and more. These topics will prepare you to apply SQL creatively to analyze and explore data; demonstrate efficiency in writing queries; create data analysis datasets; conduct feature engineering, use SQL with other data analysis and machine learning toolsets; and use SQL with unstructured data sets....
Learn SQL Basics for Data Science

Häufig gestellte Fragen

  • Sobald Sie sich für ein Zertifikat angemeldet haben, haben Sie Zugriff auf alle Videos, Quizspiele und Programmieraufgaben (falls zutreffend). Aufgaben, die von anderen Kursteilnehmern bewertet werden, können erst dann eingereicht und überprüft werden, wenn Ihr Unterricht begonnen hat. Wenn Sie sich den Kurs anschauen möchten, ohne ihn zu kaufen, können Sie womöglich auf bestimmte Aufgaben nicht zugreifen.

  • Wenn Sie sich für den Kurs anmelden, erhalten Sie Zugriff auf alle Kurse der Spezialisierung und Sie erhalten nach Abschluss aller Arbeiten ein Zertifikat. Ihr elektronisches Zertifikat wird zu Ihrer Seite „Errungenschaften“ hinzugefügt – von dort können Sie Ihr Zertifikat ausdrucken oder es zu Ihrem LinkedIn Profil hinzufügen. Wenn Sie nur lesen und den Inhalt des Kurses anzeigen möchten, können Sie kostenlos als Gast an dem Kurs teilnehmen.

Haben Sie weitere Fragen? Besuchen Sie das Hilfe-Center für Teiln..