reinforcement learning

son zamanlarda eşim, dostum her şeyim olan kısaca rl...

makine öğrenmesi’nin alt kollarından biri. makine öğrenmesi’nde genellikle markov karar süreci adı verilen bir model kullanılıyor. bu model yapay zekânın önceden bilgilendirilmesine ve yönlendirilmesine dayalı. kesin bir neden sonuç ilişkisi var. rl süreciyse ön bilgi yerine gözlem ve seçimde bulunmak üzerine kurulu. neden sonuç ilişkisinin nasıl kurulduğu bilgisi yapay zekâya verilmiyor (ya da çok az veriliyor), yapay zekâ kendisi öğreniyor.