Skip to content

Stanford CS234: Învățare prin consolidare | Iarna 2019 | Cursul 2 – Dat un model al lumii

Stanford CS234: Învățare prin consolidare |  Iarna 2019 |  Cursul 2 – Dat un model al lumii

Pentru mai multe informații despre programele profesionale și postuniversitare de inteligență artificială de la Stanford, vizitați: https://stanford.io/ai

Profesor Emma Brunskill, Universitatea Stanford
https://stanford.io/3eJW8yT

Profesorul Emma Brunskill
Asistent universitar, Informatică
Stanford AI pentru Human Impact Lab
Laboratorul de inteligență artificială Stanford
Grupul de învățare automată statistică

Pentru a urma programul cursului și programa, vizitați: http://web.stanford.edu/class/cs234/index.html

0:00 Introducere
2:55 Observabilitate completă: Procesul de decizie Markov (MDP)
3:55 Rechemare: proprietatea Markov
4:50 Procesor Markov Lanțul Markov
5:53 Exemplu: Mars Rover Markov Chain Transition Matrix, P
12:06 Exemplu: Mars Rover Markov Chain Episodes
13:05 Procesul de recompensă Markov (MRP)
14:37 Funcția de returnare și valoare
16:32 Factor de reducere
18:23 Exemplu: Mars Rover MRP
23:19 Forma matriceală a ecuației Bellman pentru MRP
26:52 Algoritm iterativ pentru calcularea valorii unui MRP
33:29 Evaluarea politicii MDP, algoritm iterativ
34:44 Evaluarea politicii: Exemplu și verificați înțelegerea dvs
36:39 Practică: MDP 1 Iterație a evaluării politicii, exemplu de rover Marte
50:48 Iterare politică MDP (PI)
55:44 Aprofundarea pasului de îmbunătățire a politicii

Cursuri interesante:

Leave a Reply

Your email address will not be published. Required fields are marked *