家政服務(wù)——機器人涉足的新領(lǐng)域

2023-05-19 11:24

來源：澎湃新聞·澎湃號·湃客

在掃地機器人風靡尋常百姓千萬家之后，一款名叫TidyBot的機器人走入了人們的視野，開啟了家政服務(wù)全新的人工智能時代。TidyBot是由普林斯頓大學、斯坦福大學和谷歌的一組研究人員，共同研發(fā)的一款能聽懂英語指令并執(zhí)行家務(wù)的機器人。基于OpenAI 的 GPT-3 Davinci 模型，TidyBot可以根據(jù)用戶的喜好，自動完成如分類洗衣服、收拾玩具和垃圾等家政服務(wù)任務(wù)。

OpenAI 的GPT-3 Davinci模型是一種深度學習模型，屬于GPT 模型系列的一部分，可以理解和生成自然語言。所謂深度學習模型，是指一類機器學習模型，其基本原理是通過多層神經(jīng)網(wǎng)絡(luò)進行特征提取和學習。深度學習模型的特點是可以從大量數(shù)據(jù)中自動學習表示，并通過反向傳播算法進行端到端的訓練。

而作為大型語言模型，GPT具有強大的總結(jié)能力。該能力與個性化機器人的泛化需求恰好匹配；同時通過大量的文本數(shù)據(jù)學習復(fù)雜的對象屬性和關(guān)系。

大型語言模型的優(yōu)勢

經(jīng)過不斷的研究訓練和改進，大型語言模型已經(jīng)展現(xiàn)出了巨大的應(yīng)用潛力。在自然語言處理領(lǐng)域，大型語言模型可以用于機器翻譯、文本摘要、情感分析等任務(wù)，大大提高了自然語言處理的效果。在智能助手和虛擬人物領(lǐng)域，大型語言模型可以模擬人類對話，與用戶進行交互，并提供智能化的服務(wù)。在教育、醫(yī)療、金融等行業(yè)，大型語言模型也有廣泛的應(yīng)用，可以輔助教學、輔助醫(yī)療決策、智能客服等。

大型語言模型不僅在語言理解和生成方面取得了顯著進展，還具備了強大的遷移學習能力。與需要昂貴的數(shù)據(jù)收集和模型訓練的傳統(tǒng)方法不同，大型語言模型利用它們從海量文本數(shù)據(jù)中學習到的強大的總結(jié)能力，可以直接“開箱即用”地實現(xiàn)機器人領(lǐng)域的泛化。

TidyBot的訓練測試

在大型語言模型的加持下，機器人具備了更強的問題解決能力。在測試訓練中，研究人員在一個基于文本的基準數(shù)據(jù)集中，輸入用戶偏好，并要求模型創(chuàng)建個性化規(guī)則來確定物品歸屬。模型將示例總結(jié)為一般規(guī)則，并使用總結(jié)來確定新物品的放置位置。結(jié)果顯示，測試在未見物品上的準確率達到了91.2%。

將該測試應(yīng)用于機器人TidyBot時，它能夠成功地收拾85%的物品。據(jù)介紹，TidyBot在操作過程中，除了應(yīng)用大型語言模型之外，還使用了圖像分類器CLIP和物體檢測器OWL-ViT。

“以前的任務(wù)規(guī)劃系統(tǒng)大多依賴于一些形式的搜索或優(yōu)化算法，這些算法不太靈活，也很難構(gòu)建。大型語言模型和多模態(tài)大型語言模型使這些系統(tǒng)能夠從互聯(lián)網(wǎng)規(guī)模的數(shù)據(jù)中受益，并輕松地用于解決新問題。” 佐治亞理工學院交互計算學院的助理教授徐丹飛說。

特別聲明

本文為澎湃號作者或機構(gòu)在澎湃新聞上傳并發(fā)布，僅代表該作者或機構(gòu)觀點，不代表澎湃新聞的觀點或立場，澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。

我要舉報

#機器人 #嘗試學習 #大型語言模型