Über diesen Kurs
16,385 kürzliche Aufrufe

100 % online

Beginnen Sie sofort und lernen Sie in Ihrem eigenen Tempo.

Flexible Fristen

Setzen Sie Fristen gemäß Ihrem Zeitplan zurück.

Stufe „Anfänger“

Ca. 18 Stunden zum Abschließen

Empfohlen: 7 hours/week...

Englisch

Untertitel: Englisch

Was Sie lernen werden

  • Check

    Use different tools to browse existing databases and tables in big data systems

  • Check

    Use different tools to explore files in distributed big data filesystems and cloud storage

  • Check

    Create and manage big data databases and tables using Apache Hive and Apache Impala

  • Check

    Describe and choose among different data types and file formats for big data systems

Kompetenzen, die Sie erwerben

Data ManagementDistributed File SystemsCloud StorageBig DataSQL

100 % online

Beginnen Sie sofort und lernen Sie in Ihrem eigenen Tempo.

Flexible Fristen

Setzen Sie Fristen gemäß Ihrem Zeitplan zurück.

Stufe „Anfänger“

Ca. 18 Stunden zum Abschließen

Empfohlen: 7 hours/week...

Englisch

Untertitel: Englisch

Lehrplan - Was Sie in diesem Kurs lernen werden

Woche
1
3 Stunden zum Abschließen

Orientation to Data in Clusters and Cloud Storage

7 Videos (Gesamt 56 min), 3 Lektüren, 1 Quiz
7 Videos
Browsing Tables with Hue7m
Browsing Tables with SQL Utility Statements6m
Browsing HDFS with the Hue File Browser13m
Browsing HDFS from the Command Line9m
Understanding S3 and Other Cloud Storage Platforms6m
Browsing S3 Buckets from the Command Line8m
3 Lektüren
Review and Preparation30m
Instructions for Downloading and Installing the Exercise Environment30m
Troubleshooting the VM5m
1 praktische Übung
Week 1 Graded Quiz30m
Woche
2
5 Stunden zum Abschließen

Defining Databases, Tables, and Columns

7 Videos (Gesamt 33 min), 12 Lektüren, 2 Quiz
7 Videos
Introduction to the CREATE TABLE Statement5m
Using Different Schemas on the Same Data12m
Specifying TBLPROPERTIES2m
Examining, Modifying, and Removing Tables1m
Hive and Impala Interoperability2m
Impala Metadata Refresh3m
12 Lektüren
Creating Databases and Tables with Hue30m
Creating Databases and Tables with SQL15m
Permissions to Create Databases and Tables5m
The ROW FORMAT Clause25m
The STORED AS Clause15m
The LOCATION Clause20m
CREATE TABLE Shortcuts10m
Using Hive SerDes15m
Working with Unstructured and Semi-Structured Data15m
Examining Table Structure10m
Dropping Databases and Tables5m
Modifying Existing Tables35m
2 praktische Übungen
Week 2 Practice Quiz20m
Week 2 Graded Quiz30m
Woche
3
3 Stunden zum Abschließen

Data Types and File Types

5 Videos (Gesamt 14 min), 12 Lektüren, 2 Quiz
5 Videos
Overview of Data Types1m
Choosing the Right Data Types4m
Overview of File Types3m
Choosing the Right File Types3m
12 Lektüren
Integer Data Types5m
Decimal Data Types10m
Character String Data Types10m
Other Data Types5m
Examining Data Types10m
Out-of-Range Values5m
Text Files5m
Avro Files5m
Parquet Files5m
ORC Files5m
Other File Types5m
Creating Tables with Avro and Parquet Files20m
2 praktische Übungen
Week 3 Practice Quiz20m
Week 3 Graded Quiz30m
Woche
4
5 Stunden zum Abschließen

Managing Datasets in Clusters and Cloud Storage

8 Videos (Gesamt 48 min), 13 Lektüren, 3 Quiz
8 Videos
Refresh Impala's Metadata Cache after Loading Data2m
Loading Files into HDFS with Hue's Table Browser10m
Loading Files into HDFS with Hue's File Browser6m
Loading Files into HDFS from the Command Line8m
Loading Files into S3 from the Command Line10m
Using Hive and Impala to Load Data into Tables3m
Conclusion2m
13 Lektüren
More about HDFS Shell Commands10m
Chaining and Scripting with HDFS Commands5m
HDFS Permissions5m
Other Ways to Load Files into S35m
S3 Permissions10m
Missing Values15m
Character Sets5m
Using Sqoop to Import Data15m
More Sqoop Import Options5m
Using Sqoop to Export Data5m
SQL LOAD DATA Statements10m
SQL INSERT Statements10m
SQL INSERT ... SELECT and CTAS Statements15m
2 praktische Übungen
Week 4 Practice Quiz20m
Week 4 Graded Quiz30m

Dozenten

Avatar

Ian Cook

Senior Curriculum Developer
Cloudera
Avatar

Glynn Durham

Senior Instructor
Cloudera

Über Cloudera

At Cloudera, we believe that data can make what is impossible today, possible tomorrow. We empower people to transform complex data into clear and actionable insights. Cloudera delivers an enterprise data cloud for any data, anywhere, from the Edge to AI. Powered by the relentless innovation of the open source community, Cloudera advances digital transformation for the world’s largest enterprises. ...

Über den Spezialisierung Modern Big Data Analysis with SQL

This Specialization teaches the essential skills for working with large-scale data using SQL. Maybe you are new to SQL and you want to learn the basics. Or maybe you already have some experience using SQL to query smaller-scale data with relational databases. Either way, if you are interested in gaining the skills necessary to query big data with modern distributed SQL engines, this Specialization is for you. Most courses that teach SQL focus on traditional relational databases, but today, more and more of the data that’s being generated is too big to be stored there, and it’s growing too quickly to be efficiently stored in commercial data warehouses. Instead, it’s increasingly stored in distributed clusters and cloud storage. These data stores are cost-efficient and infinitely scalable. To query these huge datasets in clusters and cloud storage, you need a newer breed of SQL engine: distributed query engines, like Hive, Impala, Presto, and Drill. These are open source SQL engines capable of querying enormous datasets. This Specialization focuses on Hive and Impala, the most widely deployed of these query engines. This Specialization is designed to provide excellent preparation for the Cloudera Certified Associate (CCA) Data Analyst certification exam. You can earn this certification credential by taking a hands-on practical exam using the same SQL engines that this Specialization teaches—Hive and Impala....
Modern Big Data Analysis with SQL

Häufig gestellte Fragen

  • Sobald Sie sich für ein Zertifikat angemeldet haben, haben Sie Zugriff auf alle Videos, Quizspiele und Programmieraufgaben (falls zutreffend). Aufgaben, die von anderen Kursteilnehmern bewertet werden, können erst dann eingereicht und überprüft werden, wenn Ihr Unterricht begonnen hat. Wenn Sie sich den Kurs anschauen möchten, ohne ihn zu kaufen, können Sie womöglich auf bestimmte Aufgaben nicht zugreifen.

  • Wenn Sie sich für den Kurs anmelden, erhalten Sie Zugriff auf alle Kurse der Spezialisierung und Sie erhalten nach Abschluss aller Arbeiten ein Zertifikat. Ihr elektronisches Zertifikat wird zu Ihrer Seite „Errungenschaften“ hinzugefügt – von dort können Sie Ihr Zertifikat ausdrucken oder es zu Ihrem LinkedIn Profil hinzufügen. Wenn Sie nur lesen und den Inhalt des Kurses anzeigen möchten, können Sie kostenlos als Gast an dem Kurs teilnehmen.

  • • Windows, macOS, or Linux operating system (iPads and Android tablets will not work) • 64-bit operating system (32-bit operating systems will not work) • 8 GB RAM or more • 25GB free disk space or more • Intel VT-x or AMD-V virtualization support enabled (on Mac computers with Intel processors, this is always enabled; on Windows and Linux computers, you might need to enable it in the BIOS) • For Windows XP computers only: You must have an unzip utility such as 7-Zip or WinZip installed (Windows XP’s built-in unzip utility will not work)

Haben Sie weitere Fragen? Besuchen Sie das Hilfe-Center für Teiln..