reinforcement learning
-
exploration / exploitation kavramlarinin model training asamasinda dogru kurgulanmasinin da onemli oldugu bir aı/ml algoritmasi.
ılk basta agent 'in durum hakkinda bilgisi olmadigindan rastgele secimler yapar, (bkz: exploration). zamanla daha onceki exploration'larin da isiginda daha cok educated guessler yapar, (bkz: exploitation). dolayisiyla bu algoritmanin ne zaman (bkz: exploration)larin azalip, (bkz: exploitation)larin artmasi ya da toplam secimlerin ne kadarinin (bkz: exploitation) olacagi gibi hyperparameterlari da vardir, standart aı/ml parametrelerine ek olarak.
ekşi sözlük kullanıcılarıyla mesajlaşmak ve yazdıkları entry'leri
takip etmek için giriş yapmalısın.
hesabın var mı? giriş yap