Über diesen Kurs

98,675 kürzliche Aufrufe
Zertifikat zur Vorlage
Erhalten Sie nach Abschluss ein Zertifikat
100 % online
Beginnen Sie sofort und lernen Sie in Ihrem eigenen Tempo.
Flexible Fristen
Setzen Sie Fristen gemäß Ihrem Zeitplan zurück.
Stufe „Mittel“

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode

Ca. 23 Stunden zum Abschließen
Englisch
Untertitel: Französisch, Portugiesisch (Brasilien), Russisch, Englisch, Spanisch

Kompetenzen, die Sie erwerben

Artificial Intelligence (AI)Machine LearningReinforcement LearningFunction ApproximationIntelligent Systems
Zertifikat zur Vorlage
Erhalten Sie nach Abschluss ein Zertifikat
100 % online
Beginnen Sie sofort und lernen Sie in Ihrem eigenen Tempo.
Flexible Fristen
Setzen Sie Fristen gemäß Ihrem Zeitplan zurück.
Stufe „Mittel“

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode

Ca. 23 Stunden zum Abschließen
Englisch
Untertitel: Französisch, Portugiesisch (Brasilien), Russisch, Englisch, Spanisch

von

Placeholder

University of Alberta

Placeholder

Alberta Machine Intelligence Institute

Lehrplan - Was Sie in diesem Kurs lernen werden

InhaltsbewertungThumbs Up92%(2,458 Bewertungen)Info
Woche
1

Woche 1

1 Stunde zum Abschließen

Welcome to the Course!

1 Stunde zum Abschließen
2 Videos (Gesamt 10 min), 2 Lektüren
2 Videos
Meet your instructors!8m
2 Lektüren
Reinforcement Learning Textbook10m
Read Me: Pre-requisites and Learning Objectives10m
Woche
2

Woche 2

6 Stunden zum Abschließen

Monte Carlo Methods for Prediction & Control

6 Stunden zum Abschließen
11 Videos (Gesamt 58 min), 2 Lektüren, 2 Quiz
11 Videos
Using Monte Carlo for Prediction6m
Using Monte Carlo for Action Values2m
Using Monte Carlo methods for generalized policy iteration2m
Solving the Blackjack Example3m
Epsilon-soft policies5m
Why does off-policy learning matter?4m
Importance Sampling4m
Off-Policy Monte Carlo Prediction5m
Emma Brunskill: Batch Reinforcement Learning12m
Week 1 Summary3m
2 Lektüren
Weekly Reading40m
Chapter Summary40m
1 praktische Übung
Graded Quiz30m
Woche
3

Woche 3

5 Stunden zum Abschließen

Temporal Difference Learning Methods for Prediction

5 Stunden zum Abschließen
6 Videos (Gesamt 37 min), 1 Lektüre, 2 Quiz
6 Videos
Rich Sutton: The Importance of TD Learning6m
The advantages of temporal difference learning5m
Comparing TD and Monte Carlo5m
Andy Barto and Rich Sutton: More on the History of RL12m
Week 2 Summary2m
1 Lektüre
Weekly Reading40m
1 praktische Übung
Practice Quiz30m
Woche
4

Woche 4

5 Stunden zum Abschließen

Temporal Difference Learning Methods for Control

5 Stunden zum Abschließen
9 Videos (Gesamt 30 min), 2 Lektüren, 2 Quiz
9 Videos
Sarsa in the Windy Grid World3m
What is Q-learning?3m
Q-learning in the Windy Grid World3m
How is Q-learning off-policy?4m
Expected Sarsa3m
Expected Sarsa in the Cliff World3m
Generality of Expected Sarsa1m
Week 3 Summary2m
2 Lektüren
Weekly Reading40m
Chapter summary40m
1 praktische Übung
Practice Quiz30m

Bewertungen

Top-Bewertungen von SAMPLE-BASED LEARNING METHODS

Alle Bewertungen anzeigen

Über den Spezialisierung Verstärkungslernen

The Reinforcement Learning Specialization consists of 4 courses exploring the power of adaptive learning systems and artificial intelligence (AI). Harnessing the full potential of artificial intelligence requires adaptive learning systems. Learn how Reinforcement Learning (RL) solutions help solve real-world problems through trial-and-error interaction by implementing a complete RL solution from beginning to end. By the end of this Specialization, learners will understand the foundations of much of modern probabilistic artificial intelligence (AI) and be prepared to take more advanced courses or to apply AI tools and ideas to real-world problems. This content will focus on “small-scale” problems in order to understand the foundations of Reinforcement Learning, as taught by world-renowned experts at the University of Alberta, Faculty of Science. The tools learned in this Specialization can be applied to game development (AI), customer interaction (how a website interacts with customers), smart assistants, recommender systems, supply chain, industrial control, finance, oil & gas pipelines, industrial control systems, and more....
Verstärkungslernen

Häufig gestellte Fragen

Haben Sie weitere Fragen? Besuchen Sie das Hilfe-Center für Teiln..