Porovnanie zmien: označte výberové políčka revízií, ktoré sa majú porovnať a kliknite na tlačidlo dolu.
Legenda: (aktuálna) = rozdiel oproti aktuálnej verzii, (posledná) = rozdiel oproti predchádzajúcej verzii, D = drobná úprava

  • (aktuálna | predošlá) 18:18, 31. máj 2011Maly (Diskusia | príspevky). . (753 bajtov) (+753). . (V učení posilňovaním sa využíva model čiastočne pozorovateľných Markovovských rozhodovacích procesov. Zvyčajne sa predpokladá, že agent má predpripravený model sveta (jeho stavov), ktorý na základe pozorovaní a zvolenej stratégie ohod)