Pentru mai multe informații despre programele profesionale și postuniversitare de inteligență artificială de la Stanford, vizitați: https://stanford.io/ai
Profesor Emma Brunskill, Universitatea Stanford
https://stanford.io/3eJW8yT
Profesorul Emma Brunskill
Asistent universitar, Informatică
Stanford AI pentru Human Impact Lab
Laboratorul de inteligență artificială Stanford
Grupul de învățare automată statistică
Pentru a urma programul cursului și programa, vizitați: http://web.stanford.edu/class/cs234/index.html
0:00 Introducere
2:55 Observabilitate completă: Procesul de decizie Markov (MDP)
3:55 Rechemare: proprietatea Markov
4:50 Procesor Markov Lanțul Markov
5:53 Exemplu: Mars Rover Markov Chain Transition Matrix, P
12:06 Exemplu: Mars Rover Markov Chain Episodes
13:05 Procesul de recompensă Markov (MRP)
14:37 Funcția de returnare și valoare
16:32 Factor de reducere
18:23 Exemplu: Mars Rover MRP
23:19 Forma matriceală a ecuației Bellman pentru MRP
26:52 Algoritm iterativ pentru calcularea valorii unui MRP
33:29 Evaluarea politicii MDP, algoritm iterativ
34:44 Evaluarea politicii: Exemplu și verificați înțelegerea dvs
36:39 Practică: MDP 1 Iterație a evaluării politicii, exemplu de rover Marte
50:48 Iterare politică MDP (PI)
55:44 Aprofundarea pasului de îmbunătățire a politicii
Cursuri interesante:
- Stanford CS234: Învățare prin consolidare | Iarna 2019 | Cursul 3 – Evaluarea politicilor fără modele
- Stanford CS234: Învățare prin consolidare | Iarna 2019 | Cursul 5 – Aproximarea funcției valorii
- Stanford CS234: Învățare prin consolidare | Iarna 2019 | Curs 4 – Model Free Control
- Stanford CS234: Învățare prin consolidare | Iarna 2019 | Curs 1 – Introducere – Emma Brunskill
- Stanford CS234: Învățare prin consolidare | Iarna 2019 | Cursul 16 – Căutarea arborilor din Monte Carlo
- Stanford CS229 Învățare automată I Învățare auto-supravegheată I 2022 I Cursul 16
- Ascultă de la cursanții noștri | Înțelegerea limbajului natural (XCS224U)
- Stanford CS229: Învățare automată | Vara 2019 | Cursul 7 – GDA, Naive Bayes & Laplace Smoothing
- Stanford CS229 Machine Learning I Configurare de învățare supravegheată, LMS I 2022 I Lectură 2
- Stanford CS224N | 2023 | Cursul 10 – Încurajarea, întărirea Învățarea din feedbackul uman