Skip to content

Stanford CS234: Învățare prin consolidare | Iarna 2019 | Cursul 5 – Aproximarea funcției valorii

Stanford CS234: Învățare prin consolidare |  Iarna 2019 |  Cursul 5 – Aproximarea funcției valorii

Pentru mai multe informații despre programele profesionale și postuniversitare de inteligență artificială de la Stanford, vizitați: https://stanford.io/ai

Profesor Emma Brunskill, Universitatea Stanford
http://onlinehub.stanford.edu/

Profesorul Emma Brunskill
Asistent universitar, Informatică
Stanford AI pentru Human Impact Lab
Laboratorul de inteligență artificială Stanford
Grupul de învățare automată statistică

Pentru a urma programul cursului și programa, vizitați: http://web.stanford.edu/class/cs234/index.html

0:00 Introducere
1:19 Structura clasei
3:18 Aproximarea funcției valorii (VFA)
4:26 Motivație pentru VFA
5:01 Beneficiile generalizării
10:03 Aproximatorii de funcții
11:16 Recenzie: Coborâre în gradient
13:47 Aproximarea funcției valorii pentru evaluarea politicilor cu un Oracle
15:11 Coborâre cu gradient stocastic
18:02 Model gratuit de evaluare a politicii VFA
18:22 Model Free VFA Prediction / Policy Evaluation
19:06 Vectori caracteristici
30:06 MC Aprecierea funcției valorii liniare pentru evaluarea politicilor
35:48 Baird (1995) – Exemplu similar cu evaluarea politicii MC
43:55 Garanții de convergență pentru aproximarea funcției de valoare liniară pentru evaluarea politicilor: preliminarii
50:43 Batch Monte Carlo Valoare Funcție Aproximare
53:48 Rechemare: Învățare privind diferențele temporale cu tabel de căutare
54:42 Diferența temporală (TD(0)) Învățare cu aproximarea funcției de valoare
57:40 TD(0) Aproximarea funcției valorii liniare pentru evaluarea politicilor
58:10 Exemplu Baird cu TD(0) privind evaluarea politicii

Cursuri interesante:

Leave a Reply

Your email address will not be published. Required fields are marked *