ekşi sözlük

reinforcement learning

6 entry daha

exploration / exploitation kavramlarinin model training asamasinda dogru kurgulanmasinin da onemli oldugu bir aı/ml algoritmasi.

ılk basta agent 'in durum hakkinda bilgisi olmadigindan rastgele secimler yapar, (bkz: exploration). zamanla daha onceki exploration'larin da isiginda daha cok educated guessler yapar, (bkz: exploitation). dolayisiyla bu algoritmanin ne zaman (bkz: exploration)larin azalip, (bkz: exploitation)larin artmasi ya da toplam secimlerin ne kadarinin (bkz: exploitation) olacagi gibi hyperparameterlari da vardir, standart aı/ml parametrelerine ek olarak.

hicbirseybilmeyenadam

25.06.2017 19:57