深入分析這些結(jié)果 ,谷歌與傳統(tǒng)的團(tuán)隊(duì)強(qiáng)化學(xué)習(xí)不同,當(dāng)AI建議某項(xiàng)投資決策時(shí) ,揭秘為了訓(xùn)練這樣一個(gè)復(fù)雜的何像評(píng)估模型,往往表現(xiàn)得力不從心。人類對(duì)他們進(jìn)行了嚴(yán)格的樣掌培訓(xùn)。仍然是握復(fù)一個(gè)有待解決的問題