- +1

杰弗里·辛頓:人類反饋強化學習是垃圾,就像靠刷漆來修舊車
在近日的一次訪談中,“AI教父”杰弗里·辛頓表示,“人類反饋強化學習(RLHF)是垃圾,就像靠刷漆來修舊車,我們在設計軟件時就應該確保有更合理的維護方式。”
胡逸璠
責任編輯:盧雁
+1
收藏





查看更多
澎湃矩陣
新聞報料
- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務許可證:31120170006
增值電信業(yè)務經(jīng)營許可證:滬B2-2017116
? 2014-2025 上海東方報業(yè)有限公司
反饋