- +1
家政服務(wù)——機器人涉足的新領(lǐng)域
在掃地機器人風靡尋常百姓千萬家之后,一款名叫TidyBot的機器人走入了人們的視野,開啟了家政服務(wù)全新的人工智能時代。TidyBot是由普林斯頓大學、斯坦福大學和谷歌的一組研究人員,共同研發(fā)的一款能聽懂英語指令并執(zhí)行家務(wù)的機器人。基于OpenAI 的 GPT-3 Davinci 模型,TidyBot可以根據(jù)用戶的喜好,自動完成如分類洗衣服、收拾玩具和垃圾等家政服務(wù)任務(wù)。
OpenAI 的GPT-3 Davinci模型是一種深度學習模型,屬于GPT 模型系列的一部分,可以理解和生成自然語言。所謂深度學習模型,是指一類機器學習模型,其基本原理是通過多層神經(jīng)網(wǎng)絡(luò)進行特征提取和學習。深度學習模型的特點是可以從大量數(shù)據(jù)中自動學習表示,并通過反向傳播算法進行端到端的訓練。
而作為大型語言模型,GPT具有強大的總結(jié)能力。該能力與個性化機器人的泛化需求恰好匹配;同時通過大量的文本數(shù)據(jù)學習復(fù)雜的對象屬性和關(guān)系。
大型語言模型的優(yōu)勢
經(jīng)過不斷的研究訓練和改進,大型語言模型已經(jīng)展現(xiàn)出了巨大的應(yīng)用潛力。在自然語言處理領(lǐng)域,大型語言模型可以用于機器翻譯、文本摘要、情感分析等任務(wù),大大提高了自然語言處理的效果。在智能助手和虛擬人物領(lǐng)域,大型語言模型可以模擬人類對話,與用戶進行交互,并提供智能化的服務(wù)。在教育、醫(yī)療、金融等行業(yè),大型語言模型也有廣泛的應(yīng)用,可以輔助教學、輔助醫(yī)療決策、智能客服等。
大型語言模型不僅在語言理解和生成方面取得了顯著進展,還具備了強大的遷移學習能力。與需要昂貴的數(shù)據(jù)收集和模型訓練的傳統(tǒng)方法不同,大型語言模型利用它們從海量文本數(shù)據(jù)中學習到的強大的總結(jié)能力,可以直接“開箱即用”地實現(xiàn)機器人領(lǐng)域的泛化。
TidyBot的訓練測試
在大型語言模型的加持下,機器人具備了更強的問題解決能力。在測試訓練中,研究人員在一個基于文本的基準數(shù)據(jù)集中,輸入用戶偏好,并要求模型創(chuàng)建個性化規(guī)則來確定物品歸屬。模型將示例總結(jié)為一般規(guī)則,并使用總結(jié)來確定新物品的放置位置。結(jié)果顯示,測試在未見物品上的準確率達到了91.2%。
將該測試應(yīng)用于機器人TidyBot時,它能夠成功地收拾85%的物品。據(jù)介紹,TidyBot在操作過程中,除了應(yīng)用大型語言模型之外,還使用了圖像分類器CLIP和物體檢測器OWL-ViT。
“以前的任務(wù)規(guī)劃系統(tǒng)大多依賴于一些形式的搜索或優(yōu)化算法,這些算法不太靈活,也很難構(gòu)建。大型語言模型和多模態(tài)大型語言模型使這些系統(tǒng)能夠從互聯(lián)網(wǎng)規(guī)模的數(shù)據(jù)中受益,并輕松地用于解決新問題。” 佐治亞理工學院交互計算學院的助理教授徐丹飛說。
本文為澎湃號作者或機構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機構(gòu)觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2025 上海東方報業(yè)有限公司