Über diesen Kurs

242,884 kürzliche Aufrufe
Zertifikat zur Vorlage
Erhalten Sie nach Abschluss ein Zertifikat
100 % online
Beginnen Sie sofort und lernen Sie in Ihrem eigenen Tempo.
Flexible Fristen
Setzen Sie Fristen gemäß Ihrem Zeitplan zurück.
Stufe „Mittel“

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode.

Ca. 15 Stunden zum Abschließen
Englisch
Untertitel: Englisch

Was Sie lernen werden

  • Formalize problems as Markov Decision Processes

  • Understand basic exploration methods and the exploration / exploitation tradeoff

  • Understand value functions, as a general-purpose tool for optimal decision-making

  • Know how to implement dynamic programming as an efficient solution approach to an industrial control problem

Kompetenzen, die Sie erwerben

Artificial Intelligence (AI)Machine LearningReinforcement LearningFunction ApproximationIntelligent Systems
Zertifikat zur Vorlage
Erhalten Sie nach Abschluss ein Zertifikat
100 % online
Beginnen Sie sofort und lernen Sie in Ihrem eigenen Tempo.
Flexible Fristen
Setzen Sie Fristen gemäß Ihrem Zeitplan zurück.
Stufe „Mittel“

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode.

Ca. 15 Stunden zum Abschließen
Englisch
Untertitel: Englisch

von

University of Alberta-Logo

University of Alberta

Alberta Machine Intelligence Institute-Logo

Alberta Machine Intelligence Institute

Lehrplan - Was Sie in diesem Kurs lernen werden

InhaltsbewertungThumbs Up93%(7,994 Bewertungen)Info
Woche
1

Woche 1

1 Stunde zum Abschließen

Welcome to the Course!

1 Stunde zum Abschließen
4 Videos (Gesamt 20 min), 2 Lektüren
4 Videos
Course Introduction5m
Meet your instructors!8m
Your Specialization Roadmap3m
2 Lektüren
Reinforcement Learning Textbook10m
Read Me: Pre-requisites and Learning Objectives10m
4 Stunden zum Abschließen

The K-Armed Bandit Problem

4 Stunden zum Abschließen
8 Videos (Gesamt 46 min), 3 Lektüren, 2 Quiz
8 Videos
Learning Action Values4m
Estimating Action Values Incrementally5m
What is the trade-off?7m
Optimistic Initial Values6m
Upper-Confidence Bound (UCB) Action Selection5m
Jonathan Langford: Contextual Bandits for Real World Reinforcement Learning8m
Week 1 Summary3m
3 Lektüren
Module 2 Learning Objectives10m
Weekly Reading30m
Chapter Summary30m
1 praktische Übung
Exploration/Exploitation45m
Woche
2

Woche 2

3 Stunden zum Abschließen

Markov Decision Processes

3 Stunden zum Abschließen
7 Videos (Gesamt 36 min), 2 Lektüren, 2 Quiz
7 Videos
Examples of MDPs4m
The Goal of Reinforcement Learning3m
Michael Littman: The Reward Hypothesis12m
Continuing Tasks5m
Examples of Episodic and Continuing Tasks3m
Week 2 Summary1m
2 Lektüren
Module 3 Learning Objectives10m
Weekly Reading30m
1 praktische Übung
MDPs45m
Woche
3

Woche 3

3 Stunden zum Abschließen

Value Functions & Bellman Equations

3 Stunden zum Abschließen
9 Videos (Gesamt 56 min), 3 Lektüren, 2 Quiz
9 Videos
Value Functions6m
Rich Sutton and Andy Barto: A brief History of RL7m
Bellman Equation Derivation6m
Why Bellman Equations?5m
Optimal Policies7m
Optimal Value Functions5m
Using Optimal Value Functions to Get Optimal Policies8m
Week 3 Summary4m
3 Lektüren
Module 4 Learning Objectives10m
Weekly Reading30m
Chapter Summary13m
2 praktische Übungen
Value Functions and Bellman Equations45m
Value Functions and Bellman Equations45m
Woche
4

Woche 4

4 Stunden zum Abschließen

Dynamic Programming

4 Stunden zum Abschließen
10 Videos (Gesamt 72 min), 3 Lektüren, 2 Quiz
10 Videos
Iterative Policy Evaluation8m
Policy Improvement4m
Policy Iteration8m
Flexibility of the Policy Iteration Framework4m
Efficiency of Dynamic Programming5m
Warren Powell: Approximate Dynamic Programming for Fleet Management (Short)7m
Warren Powell: Approximate Dynamic Programming for Fleet Management (Long)21m
Week 4 Summary2m
Congratulations!3m
3 Lektüren
Module 5 Learning Objectives10m
Weekly Reading30m
Chapter Summary30m
1 praktische Übung
Dynamic Programming45m

Bewertungen

Top-Bewertungen von FUNDAMENTALS OF REINFORCEMENT LEARNING

Alle Bewertungen anzeigen

Über den Spezialisierung Verstärkungslernen

The Reinforcement Learning Specialization consists of 4 courses exploring the power of adaptive learning systems and artificial intelligence (AI). Harnessing the full potential of artificial intelligence requires adaptive learning systems. Learn how Reinforcement Learning (RL) solutions help solve real-world problems through trial-and-error interaction by implementing a complete RL solution from beginning to end. By the end of this Specialization, learners will understand the foundations of much of modern probabilistic artificial intelligence (AI) and be prepared to take more advanced courses or to apply AI tools and ideas to real-world problems. This content will focus on “small-scale” problems in order to understand the foundations of Reinforcement Learning, as taught by world-renowned experts at the University of Alberta, Faculty of Science. The tools learned in this Specialization can be applied to game development (AI), customer interaction (how a website interacts with customers), smart assistants, recommender systems, supply chain, industrial control, finance, oil & gas pipelines, industrial control systems, and more....
Verstärkungslernen

Häufig gestellte Fragen

  • Der Zugang zu Vorlesungen und Aufgaben hängt von der Art Ihrer Anmeldung ab. Wenn Sie einen Kurs im Gastmodus belegen, können Sie die meisten Kursmaterialien kostenlos einsehen. Um auf benotete Aufgaben zuzugreifen und ein Zertifikat zu erhalten, müssen Sie während oder nach Ihrer Gastphase das Zertifikat erwerben. Wenn Sie die Gastoption nicht sehen:

    • Der Kurs bietet möglicherweise keine Gastoption an. Sie können stattdessen eine kostenlose Testversion ausprobieren oder finanzielle Unterstützung beantragen.
    • Der Kurs kann stattdessen "Vollständiger Kurs ohne Zertifikat" anbieten. Mit dieser Option können Sie alle Kursmaterialien einsehen, die erforderlichen Aufgaben einreichen und eine Endnote erhalten. Dies bedeutet auch, dass Sie kein Zertifikat erwerben können.
  • Wenn Sie sich für den Kurs anmelden, erhalten Sie Zugriff auf alle Kurse der Spezialisierung und Sie erhalten nach Abschluss aller Arbeiten ein Zertifikat. Ihr elektronisches Zertifikat wird zu Ihrer Seite „Errungenschaften“ hinzugefügt – von dort können Sie Ihr Zertifikat ausdrucken oder es zu Ihrem LinkedIn Profil hinzufügen. Wenn Sie nur lesen und den Inhalt des Kurses anzeigen möchten, können Sie kostenlos als Gast an dem Kurs teilnehmen.

  • Wenn Sie ein Abonnement abgeschlossen haben, erhalten Sie eine 7-tägige, kostenlose Testversion, die Sie gebührenfrei wieder kündigen können. Danach gewähren wir keine Rückerstattungen mehr, aber Sie können Ihr Abonnement jederzeit kündigen. Lesen Sie unsere vollständige Rückerstattungsrichtlinie.

  • Ja, Coursera bietet für Kursteilnehmer, die sich die Kursgebühr nicht leisten können, finanzielle Unterstützung an. Bewerben Sie sich dafür, indem Sie auf den Link für finanzielle Unterstützung links unter der Schaltfläche „Anmelden“ klicken. Sie werden zum Ausfüllen eines Antrags aufgefordert und werden bei Genehmigung benachrichtigt. Diesen Schritt müssen Sie für jeden Kurs der Spezialisierung ausführen, auch für das Abschlussprojekt. Mehr erfahren

  • Für diesen Kurs gibt es keine akademischen Leistungspunkte, doch Hochschulen können nach eigenem Ermessen Leistungspunkte für Kurszertifikate vergeben. Wenden Sie sich an Ihre Einrichtung, um mehr zu erfahren. Online-Abschlüsse und Mastertrack™-Zertifikate auf Coursera bieten die Möglichkeit, akademische Leistungspunkte zu erwerben.

Haben Sie weitere Fragen? Besuchen Sie das Hilfe-Center für Teiln..