Über diesen Kurs

76,468 kürzliche Aufrufe
Zertifikat zur Vorlage
Erhalten Sie nach Abschluss ein Zertifikat
100 % online
Beginnen Sie sofort und lernen Sie in Ihrem eigenen Tempo.
Flexible Fristen
Setzen Sie Fristen gemäß Ihrem Zeitplan zurück.
Stufe „Mittel“

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode.

Ca. 22 Stunden zum Abschließen
Englisch

Kompetenzen, die Sie erwerben

Artificial Intelligence (AI)Machine LearningReinforcement LearningFunction ApproximationIntelligent Systems
Zertifikat zur Vorlage
Erhalten Sie nach Abschluss ein Zertifikat
100 % online
Beginnen Sie sofort und lernen Sie in Ihrem eigenen Tempo.
Flexible Fristen
Setzen Sie Fristen gemäß Ihrem Zeitplan zurück.
Stufe „Mittel“

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode.

Ca. 22 Stunden zum Abschließen
Englisch

von

Placeholder

University of Alberta

Placeholder

Alberta Machine Intelligence Institute

Lehrplan - Was Sie in diesem Kurs lernen werden

InhaltsbewertungThumbs Up92%(2,076 Bewertungen)Info
Woche
1

Woche 1

1 Stunde zum Abschließen

Welcome to the Course!

1 Stunde zum Abschließen
2 Videos (Gesamt 12 min), 2 Lektüren
2 Videos
Meet your instructors!8m
2 Lektüren
Read Me: Pre-requisites and Learning Objectives10m
Reinforcement Learning Textbook10m
5 Stunden zum Abschließen

On-policy Prediction with Approximation

5 Stunden zum Abschließen
13 Videos (Gesamt 69 min), 2 Lektüren, 2 Quiz
13 Videos
Generalization and Discrimination5m
Framing Value Estimation as Supervised Learning3m
The Value Error Objective4m
Introducing Gradient Descent7m
Gradient Monte for Policy Evaluation5m
State Aggregation with Monte Carlo7m
Semi-Gradient TD for Policy Evaluation3m
Comparing TD and Monte Carlo with State Aggregation4m
Doina Precup: Building Knowledge for AI Agents with Reinforcement Learning7m
The Linear TD Update3m
The True Objective for TD5m
Week 1 Summary4m
2 Lektüren
Module 1 Learning Objectives10m
Weekly Reading: On-policy Prediction with Approximation40m
1 praktische Übung
On-policy Prediction with Approximation30m
Woche
2

Woche 2

5 Stunden zum Abschließen

Constructing Features for Prediction

5 Stunden zum Abschließen
11 Videos (Gesamt 52 min), 2 Lektüren, 2 Quiz
11 Videos
Generalization Properties of Coarse Coding5m
Tile Coding3m
Using Tile Coding in TD4m
What is a Neural Network?3m
Non-linear Approximation with Neural Networks4m
Deep Neural Networks3m
Gradient Descent for Training Neural Networks8m
Optimization Strategies for NNs4m
David Silver on Deep Learning + RL = AI?9m
Week 2 Review2m
2 Lektüren
Module 2 Learning Objectives10m
Weekly Reading: On-policy Prediction with Approximation II40m
1 praktische Übung
Constructing Features for Prediction28m
Woche
3

Woche 3

6 Stunden zum Abschließen

Control with Approximation

6 Stunden zum Abschließen
7 Videos (Gesamt 41 min), 2 Lektüren, 2 Quiz
7 Videos
Episodic Sarsa in Mountain Car5m
Expected Sarsa with Function Approximation2m
Exploration under Function Approximation3m
Average Reward: A New Way of Formulating Control Problems10m
Satinder Singh on Intrinsic Rewards12m
Week 3 Review2m
2 Lektüren
Module 3 Learning Objectives10m
Weekly Reading: On-policy Control with Approximation40m
1 praktische Übung
Control with Approximation40m
Woche
4

Woche 4

6 Stunden zum Abschließen

Policy Gradient

6 Stunden zum Abschließen
11 Videos (Gesamt 55 min), 2 Lektüren, 2 Quiz
11 Videos
Advantages of Policy Parameterization5m
The Objective for Learning Policies5m
The Policy Gradient Theorem5m
Estimating the Policy Gradient4m
Actor-Critic Algorithm5m
Actor-Critic with Softmax Policies3m
Demonstration with Actor-Critic6m
Gaussian Policies for Continuous Actions7m
Week 4 Summary3m
Congratulations! Course 4 Preview2m
2 Lektüren
Module 4 Learning Objectives10m
Weekly Reading: Policy Gradient Methods40m
1 praktische Übung
Policy Gradient Methods45m

Bewertungen

Top-Bewertungen von PREDICTION AND CONTROL WITH FUNCTION APPROXIMATION

Alle Bewertungen anzeigen

Über den Spezialisierung Verstärkungslernen

Verstärkungslernen

Häufig gestellte Fragen

Haben Sie weitere Fragen? Besuchen Sie das Hilfe-Center für Teiln..