半AGI時(shí)代的序幕已經(jīng)緩緩開啟

2023-04-04 11:58

來(lái)源：澎湃新聞·澎湃號(hào)·湃客

強(qiáng)強(qiáng)聯(lián)手：當(dāng)HuggingFace遇上了ChatGPT，HuggingGPT來(lái)了！

日前，由浙江大學(xué)與微軟亞研院聯(lián)合提出的HuggingGPT是一個(gè)利用LLM連接機(jī)器學(xué)習(xí)社區(qū)中各種AI模型以解決復(fù)雜AI任務(wù)的系統(tǒng)。例如，你給AI下達(dá)了一個(gè)任務(wù)“圖片里有幾種動(dòng)物，每種有幾只”，它就能幫你自動(dòng)分析需要哪些AI模型，然后直接去調(diào)用HuggingFace上的相應(yīng)模型，來(lái)幫你執(zhí)行并完成。整個(gè)過(guò)程，你只需要用自然語(yǔ)言將你的需求輸出。

大型語(yǔ)言模型LLM

作為一種大型語(yǔ)言模型，LLM是指包含數(shù)千億（或更多）參數(shù)的語(yǔ)言模型，這些參數(shù)是在大量文本數(shù)據(jù)上訓(xùn)練的。LLM是建立在Transformer架構(gòu)之上的，其中多頭注意力層堆疊在一個(gè)非常深的神經(jīng)網(wǎng)絡(luò)中。而LLM的涌現(xiàn)能力則被定義為“在小型模型中不存在但在大型模型中出現(xiàn)的能力”，這是LLM與以前的PLM區(qū)分開來(lái)的最顯著特征之一。

現(xiàn)有的LLM主要采用與小語(yǔ)言模型類似的模型架構(gòu)（即Transformer）和預(yù)訓(xùn)練目標(biāo)（即語(yǔ)言建模）。作為主要區(qū)別，LLM 在很大程度上擴(kuò)展了模型大小、預(yù)訓(xùn)練數(shù)據(jù)和總計(jì)算量（擴(kuò)大倍數(shù)）。他們可以更好地理解自然語(yǔ)言，并根據(jù)給定的上下文生成高質(zhì)量的文本。這種容量改進(jìn)可以用標(biāo)度律進(jìn)行部分地描述，其中性能大致遵循模型大小的大幅增加而增加。

LLM在語(yǔ)言理解、生成、交互和推理方面表現(xiàn)出的非凡能力，引起了學(xué)界和業(yè)界的極大關(guān)注，也讓人們看到了LLM在構(gòu)建AGI系統(tǒng)方面的潛力。

協(xié)作系統(tǒng)HuggingGPT

HuggingGPT是一個(gè)協(xié)作系統(tǒng)，由LLM充當(dāng)控制器、眾多專家模型作為協(xié)同執(zhí)行器。其工作流程分為四個(gè)階段：任務(wù)規(guī)劃、模型選擇、任務(wù)執(zhí)行和響應(yīng)生成。

任務(wù)規(guī)劃：ChatGPT 等 LLM 首先對(duì)用戶請(qǐng)求進(jìn)行解析，進(jìn)行任務(wù)分解，并根據(jù)其知識(shí)規(guī)劃任務(wù)順序和依賴關(guān)系；

模型選擇：LLM 將解析后的任務(wù)分配給專家模型；

任務(wù)執(zhí)行：專家模型在推理端點(diǎn)上執(zhí)行分配到的任務(wù)，并將執(zhí)行信息和推理結(jié)果記錄到 LLM

響應(yīng)生成：LLM 對(duì)執(zhí)行過(guò)程日志和推理結(jié)果進(jìn)行匯總，并將匯總結(jié)果返回給用戶。

歸結(jié)起來(lái)：當(dāng)HuggingGPT收到用戶請(qǐng)求時(shí)，使用ChatGPT進(jìn)行任務(wù)規(guī)劃，根據(jù)HuggingFace中可用的功能描述選擇模型，用選定的AI模型執(zhí)行每個(gè)子任務(wù)，并根據(jù)執(zhí)行結(jié)果匯總響應(yīng)。借助ChatGPT強(qiáng)大的語(yǔ)言能力和HuggingFace豐富的AI模型，HuggingGPT能夠完成覆蓋不同模態(tài)和領(lǐng)域的復(fù)雜AI任務(wù)，并在語(yǔ)言、視覺、語(yǔ)音等具有挑戰(zhàn)性的任務(wù)中取得令人滿意的結(jié)果。實(shí)驗(yàn)充分證明了HuggingGPT在處理多模態(tài)信息和復(fù)雜AI任務(wù)方面的強(qiáng)大能力，并且HuggingGPT 將繼續(xù)添加面向特定任務(wù)的AI模型，從而實(shí)現(xiàn)可增長(zhǎng)和可擴(kuò)展的 AI功能。HuggingGPT 為走向通用人工智能開辟了一條新的道路。

已開源的“賈維斯”

目前，關(guān)于HuggingGPT的論文已經(jīng)發(fā)布，項(xiàng)目在建設(shè)中，代碼已開源了一部分，并攬獲1.4k標(biāo)星。該項(xiàng)目沒被叫作HuggingGPT，而是取名于《鋼鐵俠》里的AI管家賈維斯（JARVIS）。

同時(shí)，它和3月份發(fā)布的Visual ChatGPT的思想非常像，這并不奇怪，因?yàn)樗鼈兌加幸粋€(gè)共同的作者，叫作微軟亞研院。而它們的區(qū)別在于HuggingGPT可調(diào)用的模型范圍擴(kuò)展了許多。

對(duì)于這個(gè)強(qiáng)大新工具的誕生，科學(xué)界紛紛表示：ChatGPT已經(jīng)成為人類創(chuàng)建的所有AI的總指揮官了；而AGI可能不是一個(gè)LLM，而是由一個(gè)“中間人”LLM連接的多個(gè)相互關(guān)聯(lián)的模型。

那么，我們是否已經(jīng)開啟了“半AGI”時(shí)代？

特別聲明

本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布，僅代表該作者或機(jī)構(gòu)觀點(diǎn)，不代表澎湃新聞的觀點(diǎn)或立場(chǎng)，澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪問(wèn)http://renzheng.thepaper.cn。

我要舉報(bào)

#AGI #LLM #HuggingGPT