Pentru mai multe informații despre programele profesionale și postuniversitare de inteligență artificială de la Stanford, vizitați: https://stanford.io/ai
Profesor Emma Brunskill, Universitatea Stanford
https://stanford.io/3eJW8yT
Profesorul Emma Brunskill
Asistent universitar, Informatică
Stanford AI pentru Human Impact Lab
Laboratorul de inteligență artificială Stanford
Grupul de învățare automată statistică
Pentru a urma programul cursului și programa, vizitați: http://web.stanford.edu/class/cs234/index.html
0:00 Introducere
3:32 Programare dinamică pentru evaluarea politicilor
5:53 Evaluarea politicii de programare dinamică
15:27 Prima vizită la Monte Carlo (MC) privind evaluarea politicilor
23:44 Fiecare vizită la Monte Carlo (MC) despre evaluarea politicilor
26:02 Monte Carlo (MC) incremental privind evaluarea politicilor, medie în curs
27:35 Verificați-vă înțelegerea: MC despre evaluarea politicilor
32:14 Evaluarea politicii MC
34:30 Limitări cheie de evaluare a politicii de la Monte Carlo (MC).
37:35 Rezumatul evaluării politicii Monte Carlo (MC).
39:40 Învățarea diferențelor temporale pentru estimarea V
48:08 Verificați-vă înțelegerea: TD Learning
56:30 Verificați-vă înțelegerea pentru programarea dinamică Metodele MC și TD, care proprietăți sunt valabile?
Cursuri interesante:
- Stanford CS234: Învățare prin consolidare | Iarna 2019 | Cursul 5 – Aproximarea funcției valorii
- Stanford CS234: Învățare prin consolidare | Iarna 2019 | Cursul 16 – Căutarea arborilor din Monte Carlo
- Stanford CS234: Învățare prin consolidare | Iarna 2019 | Cursul 2 – Dat un model al lumii
- Stanford CS234: Învățare prin consolidare | Iarna 2019 | Curs 4 – Model Free Control
- Stanford CS234: Învățare prin consolidare | Iarna 2019 | Curs 1 – Introducere – Emma Brunskill
- Procesele de decizie Markov 2 – Învățare prin consolidare | Stanford CS221: AI (toamna 2019)
- Stanford CS224N | 2023 | Cursul 10 – Încurajarea, întărirea Învățarea din feedbackul uman
- Ascultă de la cursanții noștri | Înțelegerea limbajului natural (XCS224U)
- Stanford CS224N NLP cu Deep Learning | Iarna 2021 | Cursul 9 – Auto-atenție și transformatoare
- Stanford CS330 Deep Multi-Task & Meta Learning – Adaptarea domeniului l 2022 I Cursul 13