Über diesen Kurs

58,072 kürzliche Aufrufe
Zertifikat zur Vorlage
Erhalten Sie nach Abschluss ein Zertifikat
100 % online
Beginnen Sie sofort und lernen Sie in Ihrem eigenen Tempo.
Flexible Fristen
Setzen Sie Fristen gemäß Ihrem Zeitplan zurück.
Stufe „Mittel“
Ca. 12 Stunden zum Abschließen
Englisch

Was Sie lernen werden

  • U​se the collaborative Databricks workspace and write SQL code that executes against a cluster of machines

  • Use Spark UI to analyze performance and identify bottlenecks

  • Create an end-to-end pipeline that reads data, transforms it, and saves the result

  • B​uild a linear regression model and make predictions using SparkSQL

Kompetenzen, die Sie erwerben

Data ScienceApache SparkSQL
Zertifikat zur Vorlage
Erhalten Sie nach Abschluss ein Zertifikat
100 % online
Beginnen Sie sofort und lernen Sie in Ihrem eigenen Tempo.
Flexible Fristen
Setzen Sie Fristen gemäß Ihrem Zeitplan zurück.
Stufe „Mittel“
Ca. 12 Stunden zum Abschließen
Englisch

von

Placeholder

University of California, Davis

Lehrplan - Was Sie in diesem Kurs lernen werden

Woche
1

Woche 1

3 Stunden zum Abschließen

Introduction to Spark

3 Stunden zum Abschließen
6 Videos (Gesamt 32 min), 3 Lektüren, 2 Quiz
6 Videos
Why Distributed Computing?7m
Spark DataFrames6m
The Databricks Environment8m
SQL in Notebooks3m
Import Data2m
3 Lektüren
A Note From UC Davis10m
Readings and Resources40m
Assignment #1 - Queries in Spark SQL30m
2 praktische Übungen
Assignment #1 Quiz - Queries in Spark SQL30m
Module 1 Quiz30m
Woche
2

Woche 2

2 Stunden zum Abschließen

Spark Core Concepts

2 Stunden zum Abschließen
6 Videos (Gesamt 25 min), 2 Lektüren, 2 Quiz
6 Videos
Spark Terminology3m
Caching5m
Shuffle Partitions7m
Spark UI3m
Broadcast Joins3m
2 Lektüren
Readings30m
Assignment #2 - Spark Internals30m
2 praktische Übungen
Assignment #2 Quiz - Spark Internals30m
Module 2 Quiz30m
Woche
3

Woche 3

3 Stunden zum Abschließen

Engineering Data Pipelines

3 Stunden zum Abschließen
7 Videos (Gesamt 43 min), 2 Lektüren, 2 Quiz
7 Videos
Spark as a Connector6m
Accessing Data10m
File Formats8m
Schemas and Types4m
Writing Data6m
Managed and Unmanaged Tables4m
2 Lektüren
Readings1h
Assignment #3 - Engineering Data Pipelines30m
2 praktische Übungen
Assignment #3 Quiz - Engineering Data Pipelines30m
Module 3 Quiz30m
Woche
4

Woche 4

4 Stunden zum Abschließen

Machine Learning Applications of Spark

4 Stunden zum Abschließen
7 Videos (Gesamt 35 min), 2 Lektüren, 3 Quiz
7 Videos
Applications of Machine Learning4m
Machine Learning Fundamentals6m
Linear Regression6m
Training Linear Regression Model8m
Applying Machine Learning with UDFs4m
Course Summary3m
2 Lektüren
Readings1h
Assignment #4 - Logistic Regression Classifier10m
2 praktische Übungen
Assignment #4 Quiz - Logistic Regression Classifier30m
Module 4 Quiz30m

Bewertungen

Top-Bewertungen von DISTRIBUTED COMPUTING WITH SPARK SQL

Alle Bewertungen anzeigen

Über den Spezialisierung Learn SQL Basics for Data Science

Learn SQL Basics for Data Science

Häufig gestellte Fragen

Haben Sie weitere Fragen? Besuchen Sie das Hilfe-Center für Teiln..