Skip to content

Stanford CS234: Învățare prin consolidare | Iarna 2019 | Cursul 3 – Evaluarea politicilor fără modele

Stanford CS234: Învățare prin consolidare |  Iarna 2019 |  Cursul 3 – Evaluarea politicilor fără modele

Pentru mai multe informații despre programele profesionale și postuniversitare de inteligență artificială de la Stanford, vizitați: https://stanford.io/ai

Profesor Emma Brunskill, Universitatea Stanford
https://stanford.io/3eJW8yT

Profesorul Emma Brunskill
Asistent universitar, Informatică
Stanford AI pentru Human Impact Lab
Laboratorul de inteligență artificială Stanford
Grupul de învățare automată statistică

Pentru a urma programul cursului și programa, vizitați: http://web.stanford.edu/class/cs234/index.html

0:00 Introducere
3:32 Programare dinamică pentru evaluarea politicilor
5:53 Evaluarea politicii de programare dinamică
15:27 Prima vizită la Monte Carlo (MC) privind evaluarea politicilor
23:44 Fiecare vizită la Monte Carlo (MC) despre evaluarea politicilor
26:02 Monte Carlo (MC) incremental privind evaluarea politicilor, medie în curs
27:35 Verificați-vă înțelegerea: MC despre evaluarea politicilor
32:14 Evaluarea politicii MC
34:30 Limitări cheie de evaluare a politicii de la Monte Carlo (MC).
37:35 Rezumatul evaluării politicii Monte Carlo (MC).
39:40 Învățarea diferențelor temporale pentru estimarea V
48:08 Verificați-vă înțelegerea: TD Learning
56:30 Verificați-vă înțelegerea pentru programarea dinamică Metodele MC și TD, care proprietăți sunt valabile?

Cursuri interesante:

Leave a Reply

Your email address will not be published. Required fields are marked *