個(gè)人隨筆 算法人生(1):從“強(qiáng)化學(xué)習(xí)”看如何“戰(zhàn)勝拖延” 強(qiáng)化學(xué)習(xí)是一種機(jī)器學(xué)習(xí)方法,是一個(gè)動(dòng)態(tài)的、可迭代的過程,需要進(jìn)行試錯(cuò),并找到正確的策略。本文從“強(qiáng)化學(xué)習(xí)”看如何“戰(zhàn)勝拖延”,一起來看看吧。 養(yǎng)心進(jìn)行時(shí) 強(qiáng)化學(xué)習(xí)策略迭代算法