關于 Manus 這類產(chǎn)品,我想說...
從 Manus 發(fā)布至今,圍繞著這類通用型智能體的討論從沒停過。如今,在輿情平息的時候,我們覺得是時候好好評價一下這類產(chǎn)品了。
首先,我們稱贊 Manus 這類產(chǎn)品的構建思路 —— 通過多模型協(xié)作,確實在向傳說中的 “世界大模型” 靠近。但實際測試中卻暴露不少問題:號稱 “重新定義 AI 協(xié)作” 的 Manus,內(nèi)測時生成 PPT 打不開 WPS、股票分析用錯數(shù)據(jù)等。
這類產(chǎn)品的出現(xiàn)確實推動了行業(yè)討論。但從實際可用性來看,目前多數(shù)通用智能體都像 Manus 一樣 “噱頭大于實用”。
以下是我們針對目前三款“通用 Agent”產(chǎn)品的主觀評價:
總的來說,目前三款產(chǎn)品可用性不足,任務成功率低,文字相關能力與 LLM 原生功能無異,通用 Agent 附加價值有限。
1. Manus
主觀評分:☆☆
信息收集:可訪問網(wǎng)頁及讀取其中的圖片及pdf文檔內(nèi)容
編程:接入Claude代碼大模型
PPT生成:可編輯,但質(zhì)量較差
圖像生成:不支持
視頻生成:不支持
資費:免費,1000積分/月;Starter/Pro,$39/$399月
2. Genspark
主觀評分:☆
信息收集:可訪問網(wǎng)頁及讀取其中的圖片及pdf文檔內(nèi)容
編程:接入多種代碼大模型混合使用
PPT生成:使用代碼方式寫PPT,效果還可以,但不可編輯
圖像生成:直接接入Flux,ideogram等圖像大模型
視頻生成:直接接入可靈,minimax等視頻大模型
資費:免費,200積分/日;Plus版,24.99美元/月
3. 扣子空間
主觀評分:☆
信息收集:可訪問網(wǎng)頁及讀取其中的圖片及pdf文檔內(nèi)容
編程:接入豆包代碼大模型
PPT生成:視覺以及結構還可以,同時提供了PDF、PPT、文字三個版本,可二次編輯:
圖像生成:支持添加MCP拓展圖片生成:
視頻生成:不支持
資費:目前完全免費,每日有4-5個任務限制
1. 核心架構
基礎模塊:信息收集、信息分析、代碼編寫,無生成圖片視頻等多模態(tài)功能。
它通過多代理架構將任務拆分為規(guī)劃、執(zhí)行、驗證等子模塊,每個代理基于獨立的語言模型或強化學習模型,通過 API 協(xié)同工作;
優(yōu)勢
- 工作流程條理性較強,先確定任務步驟,按步驟依次進行,;
- 推理過程所使用的文件均可以下載,推理流程較為透明;
劣勢
- 需要魔法上網(wǎng),對部分用戶可能有使用門檻;
- 多模態(tài)能力較弱,缺乏圖像處理等多模態(tài)工具;
- 工具集較為有限,嚴重依賴Python腳本,可以生成PPT格式的文件,但質(zhì)量較差,無法二次編輯;
- 性能方面,推理過程較慢,從收集資料到生成分析文檔總計要消耗近30min。
2. 代碼生成
代碼方面因為是直接調(diào)用了其他 LLM 模型,所以性能與其一致。以下是生成的前端頁面。
3. 多模態(tài)分析功能
對于圖像有基本的分類功能,但是沒有配置針對圖像處理的模型,處理分析功能效果不好。
深度分析
收集信息,使用代碼方式生成調(diào)研報告,并發(fā)布在網(wǎng)頁,對于信源等搜索分析不全面,與其他 AI 工具無大異。
1. 核心架構
基礎模塊:AI 對話/生圖/視頻/翻譯,沿用 ChatGPT、可靈等主流模型;
工具型智能體,5 類專業(yè)場景應用:綜合智能體,深度研究智能體,事實核查智能體,數(shù)據(jù)表智能體,打電話智能體;
宣傳中"80+工具"實際是基于“AI 聊天,AI 生圖,AI 視頻,翻譯“等類型工具的排列組合。
優(yōu)勢
- 功能模塊全面,包括AI搜索與瀏覽器、圖片工作室、視頻生成、深度研究等。
- 任務執(zhí)行效率高,尤其在多輪對話和復雜任務處理上
劣勢
- 需要魔法上網(wǎng),對部分用戶可能有使用門檻;
- 工具創(chuàng)新不足:超90%功能與競品同質(zhì)化,唯視頻生成系獨家配置(當前質(zhì)量未達可用標準),尚未形成真實競爭力;
- 技術整合度低:多模型簡單堆砌,缺乏深度調(diào)優(yōu);
- 營銷與實際落差:概念智能體未突破傳統(tǒng)Agent框架,格式轉(zhuǎn)換等工具實為API封裝
2. 綜合分析能力
實際使用流程與 Manus 一致,輸入一個任務,Genspark 開始自動安排工作,完成后輸出結果,生成 PPT 視覺效果還可以,但無法二次編輯修改。
3. AI 聊天
官方宣傳其多模型集成系統(tǒng)(含 GPT-4、Claude3 及自研模型),但實測認為在常規(guī)對話、文本生成和信息檢索等基礎場景中,該系統(tǒng)表現(xiàn)與單一優(yōu)質(zhì)模型并無顯著差異。
4. 圖像生成
Genspark 會寫一套提示詞,然后使用 Flux 等公開模型(舊版模型)直接生成圖片。生成效果差于直接使用生圖工具。
5. 視頻生成
視頻生成模型使用的是可靈等開放模型,生成清晰度低,視頻不穩(wěn)定,消耗積分大,僅一次就消耗掉了當日所有免費積分,視頻效果差于可靈等生視頻工具。
1. 核心架構
Agent:
- 通用 agent:與 Manus 相似。
- 專家 agent:針對通用 agent 做了內(nèi)置 prompt,目前是用戶研究、股票分析。
兩種主要模式:
- 探索模式:不可修改任務規(guī)劃步驟。
- 規(guī)劃模式:可修改 Ai 規(guī)劃任務步驟內(nèi)容。
支持接入圖片生成 MCP 產(chǎn)出圖片,基于豆包大模型可處理多模態(tài)數(shù)據(jù)。
優(yōu)勢
- 不需要魔法上網(wǎng),目前完全免費;
- 提供探索和規(guī)劃兩種模式,用戶可以修改agent規(guī)劃的步驟細節(jié)內(nèi)容;
- 支持MCP擴展,AI agent的能力邊界被進一步擴展。
劣勢
- 官方宣傳的“各行各業(yè)的「領域?qū)<摇梗壳爸挥袃蓚€,且無法使用規(guī)劃模式調(diào)整執(zhí)行任務內(nèi)容。
- MCP擴展目前是固定列表且不支持自定義,應用空間有限。
- 性能上,依賴豆包模型的邏輯能力,復雜任務(如商業(yè)模型分析)易出現(xiàn)細節(jié)缺失,規(guī)劃模式推理過程較慢,從暫時不具備可用性。
- 完成任務一段時間后無法進行二次對話,任務永遠結束。
- Beta版本全免費,高峰期服務器易擁堵,易出現(xiàn)影響響應速度。
2. 通用 agent(探索模式) 任務:品牌對比分析報告
通用 agent:進行第一輪、第二輪快速思考和瀏覽器搜索。搜到信息后生成并部署網(wǎng)頁缺點:數(shù)據(jù)不夠新,目前還是 2023 年的內(nèi)容。目前生成文檔每句話引用未標注來源,可信程度存疑。
3. 專家 agent 任務:生成問卷
左側(cè)為扣子空間、右側(cè)為 deepseek,使用了相同的 prompt,對比 deepseek,扣子空間生成的問卷更加全面、分類更準確、問題語言更清晰易懂。
4. 通用 agent(規(guī)劃模式) 任務:生成競品分析并生成筆記
執(zhí)行時間較長,針對復雜任務需要 10 分鐘以上,同時在生成筆記中有概率會出現(xiàn)報錯的問題。生成筆記信息不全面,出現(xiàn)關鍵細節(jié)缺失,分析不全面等問題。
5. MCP agent(探索模式) 任務:生成可視化旅行攻略
可以調(diào)用高德地圖與墨跡天氣的信息并適時設計旅行線路,同時可以導出至飛書表格直接生成攻略。
6. MCP agent(探索模式) 任務:生成一個會跳舞的貓
調(diào)用圖像工具 MCP,生成的圖像清晰但是對于主體的處理不符合事實,需要二次修改。
從 Manus、Genspark 到扣子空間,通用智能體產(chǎn)品雖在技術架構上嘗試通過多模型整合、任務拆分等方式向 “世界大模型” 靠近,但實際使用中仍存在明顯局限。
目前來看,這類產(chǎn)品普遍能力和問題相似,如信息收集、代碼生成等能力差異不大,且多模態(tài)支持不足(如圖像、視頻生成功能缺失或質(zhì)量較低)。同時,使用體驗上存在穩(wěn)定性不足、付費策略不夠合理(如積分消耗快、套餐價格較高)、部分產(chǎn)品需依賴魔法上網(wǎng)等問題,影響了實際可用性。
未來,通用智能體需在技術生態(tài)建設、性能優(yōu)化、付費體系完善等方面持續(xù)改進,才能從概念層面的討論走向?qū)嶋H應用場景的落地,真正實現(xiàn)從 “有限可用” 到 “可用” 的跨越。
復制本文鏈接 文章為作者獨立觀點不代表優(yōu)設網(wǎng)立場,未經(jīng)允許不得轉(zhuǎn)載。
發(fā)評論!每天贏獎品
點擊 登錄 后,在評論區(qū)留言,系統(tǒng)會隨機派送獎品
2012年成立至今,是國內(nèi)備受歡迎的設計師平臺,提供獎品贊助 聯(lián)系我們
標志設計標準教程
已累計誕生 729 位幸運星
發(fā)表評論 為下方 9 條評論點贊,解鎖好運彩蛋
↓ 下方為您推薦了一些精彩有趣的文章熱評 ↓