- +1
半AGI時(shí)代的序幕已經(jīng)緩緩開啟
強(qiáng)強(qiáng)聯(lián)手:當(dāng)HuggingFace遇上了ChatGPT,HuggingGPT來(lái)了!
日前,由浙江大學(xué)與微軟亞研院聯(lián)合提出的HuggingGPT是一個(gè)利用LLM連接機(jī)器學(xué)習(xí)社區(qū)中各種AI模型以解決復(fù)雜AI任務(wù)的系統(tǒng)。例如,你給AI下達(dá)了一個(gè)任務(wù)“圖片里有幾種動(dòng)物,每種有幾只”,它就能幫你自動(dòng)分析需要哪些AI模型,然后直接去調(diào)用HuggingFace上的相應(yīng)模型,來(lái)幫你執(zhí)行并完成。整個(gè)過(guò)程,你只需要用自然語(yǔ)言將你的需求輸出。
大型語(yǔ)言模型LLM
作為一種大型語(yǔ)言模型,LLM是指包含數(shù)千億(或更多)參數(shù)的語(yǔ)言模型,這些參數(shù)是在大量文本數(shù)據(jù)上訓(xùn)練的。LLM是建立在Transformer架構(gòu)之上的,其中多頭注意力層堆疊在一個(gè)非常深的神經(jīng)網(wǎng)絡(luò)中。而LLM的涌現(xiàn)能力則被定義為“在小型模型中不存在但在大型模型中出現(xiàn)的能力”,這是LLM與以前的PLM區(qū)分開來(lái)的最顯著特征之一。
現(xiàn)有的LLM主要采用與小語(yǔ)言模型類似的模型架構(gòu)(即Transformer)和預(yù)訓(xùn)練目標(biāo)(即語(yǔ)言建模)。作為主要區(qū)別,LLM 在很大程度上擴(kuò)展了模型大小、預(yù)訓(xùn)練數(shù)據(jù)和總計(jì)算量(擴(kuò)大倍數(shù))。他們可以更好地理解自然語(yǔ)言,并根據(jù)給定的上下文生成高質(zhì)量的文本。這種容量改進(jìn)可以用標(biāo)度律進(jìn)行部分地描述,其中性能大致遵循模型大小的大幅增加而增加。
LLM在語(yǔ)言理解、生成、交互和推理方面表現(xiàn)出的非凡能力,引起了學(xué)界和業(yè)界的極大關(guān)注,也讓人們看到了LLM在構(gòu)建AGI系統(tǒng)方面的潛力。
協(xié)作系統(tǒng)HuggingGPT
HuggingGPT是一個(gè)協(xié)作系統(tǒng),由LLM充當(dāng)控制器、眾多專家模型作為協(xié)同執(zhí)行器。其工作流程分為四個(gè)階段:任務(wù)規(guī)劃、模型選擇、任務(wù)執(zhí)行和響應(yīng)生成。
任務(wù)規(guī)劃:ChatGPT 等 LLM 首先對(duì)用戶請(qǐng)求進(jìn)行解析,進(jìn)行任務(wù)分解,并根據(jù)其知識(shí)規(guī)劃任務(wù)順序和依賴關(guān)系;
模型選擇:LLM 將解析后的任務(wù)分配給專家模型;
任務(wù)執(zhí)行:專家模型在推理端點(diǎn)上執(zhí)行分配到的任務(wù),并將執(zhí)行信息和推理結(jié)果記錄到 LLM
響應(yīng)生成:LLM 對(duì)執(zhí)行過(guò)程日志和推理結(jié)果進(jìn)行匯總,并將匯總結(jié)果返回給用戶。
歸結(jié)起來(lái):當(dāng)HuggingGPT收到用戶請(qǐng)求時(shí),使用ChatGPT進(jìn)行任務(wù)規(guī)劃,根據(jù)HuggingFace中可用的功能描述選擇模型,用選定的AI模型執(zhí)行每個(gè)子任務(wù),并根據(jù)執(zhí)行結(jié)果匯總響應(yīng)。借助ChatGPT強(qiáng)大的語(yǔ)言能力和HuggingFace豐富的AI模型,HuggingGPT能夠完成覆蓋不同模態(tài)和領(lǐng)域的復(fù)雜AI任務(wù),并在語(yǔ)言、視覺、語(yǔ)音等具有挑戰(zhàn)性的任務(wù)中取得令人滿意的結(jié)果。實(shí)驗(yàn)充分證明了HuggingGPT在處理多模態(tài)信息和復(fù)雜AI任務(wù)方面的強(qiáng)大能力,并且HuggingGPT 將繼續(xù)添加面向特定任務(wù)的AI模型,從而實(shí)現(xiàn)可增長(zhǎng)和可擴(kuò)展的 AI功能。HuggingGPT 為走向通用人工智能開辟了一條新的道路。
已開源的“賈維斯”
目前,關(guān)于HuggingGPT的論文已經(jīng)發(fā)布,項(xiàng)目在建設(shè)中,代碼已開源了一部分,并攬獲1.4k標(biāo)星。該項(xiàng)目沒被叫作HuggingGPT,而是取名于《鋼鐵俠》里的AI管家賈維斯(JARVIS)。
同時(shí),它和3月份發(fā)布的Visual ChatGPT的思想非常像,這并不奇怪,因?yàn)樗鼈兌加幸粋€(gè)共同的作者,叫作微軟亞研院。而它們的區(qū)別在于HuggingGPT可調(diào)用的模型范圍擴(kuò)展了許多。
對(duì)于這個(gè)強(qiáng)大新工具的誕生,科學(xué)界紛紛表示:ChatGPT已經(jīng)成為人類創(chuàng)建的所有AI的總指揮官了;而AGI可能不是一個(gè)LLM,而是由一個(gè)“中間人”LLM連接的多個(gè)相互關(guān)聯(lián)的模型。
那么,我們是否已經(jīng)開啟了“半AGI”時(shí)代?
本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場(chǎng),澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪問(wèn)http://renzheng.thepaper.cn。





- 澎湃新聞微博
- 澎湃新聞公眾號(hào)
- 澎湃新聞抖音號(hào)
- IP SHANGHAI
- SIXTH TONE
- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2025 上海東方報(bào)業(yè)有限公司