Pentru mai multe informații despre programele profesionale și postuniversitare de inteligență artificială de la Stanford, vizitați: https://stanford.io/ai
Profesor Emma Brunskill, Universitatea Stanford
http://onlinehub.stanford.edu/
Profesorul Emma Brunskill
Asistent universitar, Informatică
Stanford AI pentru Human Impact Lab
Laboratorul de inteligență artificială Stanford
Grupul de învățare automată statistică
Pentru a urma programul cursului și programa, vizitați: http://web.stanford.edu/class/cs234/index.html
0:00 Introducere
1:19 Structura clasei
3:18 Aproximarea funcției valorii (VFA)
4:26 Motivație pentru VFA
5:01 Beneficiile generalizării
10:03 Aproximatorii de funcții
11:16 Recenzie: Coborâre în gradient
13:47 Aproximarea funcției valorii pentru evaluarea politicilor cu un Oracle
15:11 Coborâre cu gradient stocastic
18:02 Model gratuit de evaluare a politicii VFA
18:22 Model Free VFA Prediction / Policy Evaluation
19:06 Vectori caracteristici
30:06 MC Aprecierea funcției valorii liniare pentru evaluarea politicilor
35:48 Baird (1995) – Exemplu similar cu evaluarea politicii MC
43:55 Garanții de convergență pentru aproximarea funcției de valoare liniară pentru evaluarea politicilor: preliminarii
50:43 Batch Monte Carlo Valoare Funcție Aproximare
53:48 Rechemare: Învățare privind diferențele temporale cu tabel de căutare
54:42 Diferența temporală (TD(0)) Învățare cu aproximarea funcției de valoare
57:40 TD(0) Aproximarea funcției valorii liniare pentru evaluarea politicilor
58:10 Exemplu Baird cu TD(0) privind evaluarea politicii
Cursuri interesante:
- Stanford CS234: Învățare prin consolidare | Iarna 2019 | Cursul 3 – Evaluarea politicilor fără modele
- Stanford CS234: Învățare prin consolidare | Iarna 2019 | Cursul 2 – Dat un model al lumii
- Stanford CS234: Învățare prin consolidare | Iarna 2019 | Curs 1 – Introducere – Emma Brunskill
- Stanford CS234: Învățare prin consolidare | Iarna 2019 | Curs 4 – Model Free Control
- Stanford CS229: Învățare automată – Regresie liniară și coborâre gradient | Cursul 2 (toamna 2018)
- Stanford CS234: Învățare prin consolidare | Iarna 2019 | Cursul 16 – Căutarea arborilor din Monte Carlo
- Stanford CS224W: ML cu grafice | 2021 | Cursul 9.2 – Proiectarea celor mai puternice GNN
- Machine Learning 2 – Caracteristici, rețele neuronale | Stanford CS221: AI (toamna 2019)
- Stanford CS224W: ML cu grafice | 2021 | Cursul 3.2-Abordări aleatorii de mers pentru înglobarea nodurilor
- Stanford CS224W: ML cu grafice | 2021 | Cursul 13.4 – Detectarea comunităților suprapuse