长兴郴障科技有限公司

澎湃Logo
下載客戶端

登錄

  • +1

Manus實測,它和DeepSeek有什么不同?

澎湃新聞記者 孔家興 王亞賽 杜海燕 舒怡爾 實習生 梁希昀
2025-03-21 11:59
來源:澎湃新聞
? 對齊Lab >
字號

自3月5日開啟內測以來,人工智能應用 Manus 出圈走紅。3月12日晚間,Manus在自有 X 賬號上表示,7天以來Manus使用申請等候名單增加到兩百萬人次。

澎湃新聞·對齊Lab在獲得內測碼后,使用Manus進行了四種任務測試。總體而言,Manus作為“開箱即用”的創新智能體應用有不少優點:交互界面友好、拆解需求能力強、多AI協作有條不紊、設計功底強,但在信息整合能力、細節優化、交付完成度上還有待提高。

Manus和AI Agent究竟是什么?

有別于之前爆火的DeepSeek,Manus并不是一個新的人工智能大模型,而是一款讓AI大模型協作的人工智能體(AI Agent)。也就是說,Manus不創造大模型,而是使用市面上已經存在的大模型打造了一個為人服務的“助理”。理論上,AI Agent能夠以類似人類的方式工作,通過大模型來“理解”用戶需求,“規劃”達成目標的路徑,調用包括大模型在內的各種“工具”來執行任務。

Manus所處的AI Agent賽道剛剛興起,雖然不乏競品,卻還沒有產生現象級的產品。

Smiliarweb數據顯示,在2月全球增速最高的10個AI產品中,只有Dify一家與Agent概念有關(Manus目前處于逐步放開的測試階段)。但Dify更準確的定位是Agent開發平臺,并不是像Manus這樣的AI Agent應用。AI產品中流量最高的,還是集中在AI聊天機器人這個品類。但從全球AI APP的訪問量總榜來看,除了DeepSeek這樣的新晉爆款,其他高訪問量AI產品大多是上榜多時且存在增長困難的問題。

平均一個任務用時40分鐘,Manus擅長做什么?

從Manus官方和Discord社區發布的測試案例來看,網頁、報告、PPT是用戶希望Manus生成的主要內容產品,符合大部分打工人、學生群體的需求。

根據不同的任務難度,我們分別測試了Manus在svg圖像生成、數據可視化、游戲設計、數據挖掘、網頁交互設計等方面的能力。

我們使用理解能力、準確性、設計能力和代碼能力這四個維度,對Manus測試過的四個任務進行了評估。Manus最擅長的是理解需求后拆解任務,在不同任務難度下均能達到7分以上的標準(滿分10分)。此外,Manus的網頁設計能力和審美也值得稱贊。在“小王子智能體世界”項目中,Manus在沒有提示詞的引導下,通過理解故事和設定自主完成了風格化的設計。

Manus 的工作原理是使用多個 AI 模型協同決策,這些 AI 模型會自動拆解任務目標、生成執行計劃,調用工具接口完成文件操作、數據處理等任務,并實時根據反饋動態調整策略,實現復雜任務的自主執行,從而實現一句提示詞就將任務執行到底的效果。Manus 的所有工作流程均在云端虛擬機上完成。

提示詞和參考資料越詳細,項目的完成效果可能越好。“上海賞櫻地圖網頁”的項目里,我們將上海市各區的賞櫻地點、花期等信息整理成表格喂給Manus,生成內容的質量明顯提升,任務用時也是4個任務中最短的。可見,信息檢索和數據爬取等內容整合工作,是比較費時費力的。

為了更好地說明Manus的工作原理,我們在上海賞櫻地圖的任務回放基礎上,制作了一個解釋Manus工作流程的視頻。

AI永遠“使命必達”,幻覺問題更加凸顯

在 Manus 執行任務的各個環節中,我們最關心的是資料和數據收集的準確性及整合能力。在 “模擬投資網頁游戲” 中,我們要求 Manus 生成不同歷史階段的投資標的數據。以梳理 2005 年每月黃金價格為例,Manus 的梳理方法是依據新聞報道篩選出核心事件,比如 “2005 年,黃金價格突破 450 美元 / 盎司”,然后結合相關歷史數據和統計方法,通過特定算法生成模擬趨勢的數據。

通過核查2005年的黃金價格后可知,2005年全球黃金市場的月均價格確實一度超過了450 美元 / 盎司,但Manus提供的每月黃金數據與真實數據均有不同程度的偏差。也就是說,這些數據是 AI 在滿足當年突破 450 美元這一點的基礎上“填空”出來的。然而,這個生造數據的過程, AI 并不會告訴你。這也就是各家大模型都在努力解決的 AI 幻覺問題,Manus 調用的是現成的大模型,也自然存在著這樣的幻覺問題。

圖中顯示,Manus基于歷史數據模擬了數據的趨勢。圖片來源:澎湃新聞·對齊Lab Manus實測

如果不去細摳任務中的各個環節,不論是網頁、PPT還是報告,Manus的工作成果可以用可圈可點來形容。加上Manus允許用戶實時觀看自己的操作過程,給人一種信賴感。這種產品設計上的技巧,規避了AI的一些能力不足的問題。

這是市面上一些大模型和AI應用的通病,通過營造出一種什么問題都能解決的氛圍,來滿足市場和用戶的期待。尤其是在需求溝通、任務執行和總結匯報上,AI給出的范式總是有模有樣。加上擅長“高情商的表達”,給用戶提供了很多情緒價值。但仔細去核驗的話,幻覺、誤用、不準確等問題其實并不少見。畢竟在激烈的競爭中,AI是不會輕易和你說它做不到的。

從實測體驗來說,以Manus為代表的AI Agent確實在把完成一件事的門檻越拉越低,但也把做好一件事的標準越拉越高。越是對創意有著高要求,對內容準確性、真實性近乎嚴苛的領域,流程化的工具就只能陪你半程。更加精準地理解世界、理解人類,將成為決定工作品質與成果的關鍵,讓個人在未來的競爭格局中占據一席之地。

作為一個串聯AI大模型的工具,Manus也有很多當下大模型的通病。但在涉及隱私等重要的細節問題上,Manus的很多處理方式還是值得借鑒的。比如,Manus不會使用用戶提供的API,哪怕你強制要求它使用;在涉及兒童相關的內容時,即便沒有提示詞的引導,Manus也會加上一個工作步驟,去驗證內容和設計是不是適合兒童觀看;Manus會讓用戶選擇是否將項目部署到公網。這些機制和設定,都能體現一款產品對人的尊重和保護。

在每一次等待 Manus 創作的過程中,雖然實際時長遠遠短于人類自己創作的時長,但期盼的心情總釀成一種度秒如年的感受。

這種感受,就像在電腦剛剛普及的年代,你守在一臺老式電腦前,眼巴巴地看著一張圖像逐行加載。每一行像素的顯現,都勾得人心癢癢。那一刻,就仿佛望向互聯網時代的大門。而現如今, AI 雖有各種不完美,但也同樣給人一種希望,新技術引領的新時代又再次開啟了。

澎湃新聞·對齊Lab Manus實測項目回看:

1、上海賞櫻數據可視化項目設計,https://manus.im/share/Pihrl1JUmNZ0moPhoWfyh6?replay=1

2、AI公司產品的交互式可視化網頁設計,https://manus.im/share/MoZ9vlZnUVWnuG49BNFqjG?replay=1

3、小王子世界觀AI代理網頁游戲設計,https://manus.im/share/5ZuJ0R75Clzr7X6iaNLFNb?replay=1

4、什么是AI大模型的通俗講解SVG卡片,https://manus.im/share/uytfTaasg9O9JpPnJU40jx?replay=1

    責任編輯:呂妍
    校對:張艷
    澎湃新聞報料:021-962866
    澎湃新聞,未經授權不得轉載
    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網安備31010602000299號

            互聯網新聞信息服務許可證:31120170006

            增值電信業務經營許可證:滬B2-2017116

            ? 2014-2025 上海東方報業有限公司

            反饋
            百家乐庄闲赢负表| 威尼斯人娱乐欢迎您| 百家乐官网霸王闲| 瑞丰娱乐场| 百家乐棋牌游戏币| 澳门百家乐玩法心得技巧| 百家乐官网游戏台| 大发888游戏平台df888| 百家乐公式论坛| 百家乐看单技术| 百家乐官网真人玩下载| 威尼斯人娱乐场 赌场网址| 百家乐盛大娱乐城城| 网上百家乐官网正规代理| 城口县| 大发888二十一点| 百家乐学院| 博发百家乐游戏| 百家乐官网斗地主下载| 百家乐官网庄比闲多多少| 百家乐一拖三| 圣淘沙百家乐娱乐城| 闲和庄百家乐官网的玩法技巧和规则| 百家乐官网有方式赢钱吗| 多伦县| 现金投注网| 喀喇| 廊坊市| 金赞百家乐官网娱乐城| 菲律宾百家乐官网试玩| 博九网| 新锦江娱乐城备用网址| 大发88846| 大发888娱乐场注册| 百家乐投注方法多不多| 24山64卦分金| 凯旋门百家乐游戏| OG百家乐大转轮| 全景网百家乐的玩法技巧和规则| 百家乐双峰县| 威尼斯人娱乐城官方地址|