一個有趣的 Agent 測試:做一份圖文并茂的關于地球地質年代歷史的分享報告。
任務涉及行動規劃、資料搜集、內容組織、排版設計、文件格式轉換,可以感受一下目前的智能體們大概到了什么水準,離實際可用距離還遠不遠,卡點在什么地方。
測試了 4 個 Agent 產品:天工、扣子空間、Manus、Lovart,結果如下。
完成度最高,是唯一一個最終能輸出 PPT 格式文件的工具。
完整效果見: https://tiangong.cn/share/v2/ppt/1925788478895357952
在接到任務后,它有一個確認任務范圍的過程。我盡量往詳細了選,它最終輸出的內容是幾家里最豐富的。
接下來有個規劃過程,它給自己準備了任務清單,并在整個執行過程中不斷回來檢查。
中間的執行過程非常長,節選部分,但無外乎搜索和瀏覽 2 種行為。
信息充分收集后,它會先寫 PPT 大綱。
最后生成 PPT 的過程,其實是先做了十幾個網頁,擺在一起展示。
在下載的時候,才把網頁轉換成一頁頁 PPT,合并到一個文件里,所以下載要等很久。甚至如果你下載 HTML 格式,它下下來的是個文件夾,里面有十幾個網頁,分開的。
但它合成的 PPT 文件實用價值不高。因為在生成每一頁的時候,它沒有嚴格控制尺寸,每頁尺寸略微不同,許多頁底部都出現空白。
再加上生成網頁時就有少量排版錯亂的地方,最終結果并不完美。
不過,需要人工調整的地方并不多,具有相當高的潛力。
扣子空間不能直接生成 PPT,它最終給了我一份文檔。不過形式不重要,這也算完成了任務。
完整效果見: https://space.coze.cn/s/bSmamok4LFg/
它的任務執行過程簡略一些,但也類似。規劃、收集資料、找網絡圖片、整合內容。
用扣子空間的時候,我特意為它打開了兩個擴展:飛書云文檔和圖像生成工具,想看看它會不會用到。實際上一個都沒用,它并沒有把報告寫到飛書文檔里,也沒有生成圖片插入報告。這個結果符合預期,畢竟沒有明確給它這樣的指示。而且,在這種報告里,網圖顯然優于生成的圖片,這不是講究美觀的時候。
Manus 給了我一個 PDF,純文字的。任務算是失敗。
完整效果見: https://manus.im/share/DdcDQMgzQ59pWvI2akPuiD?replay=1
它的執行過程,也合乎邏輯。
雖然沒有單獨把任務規劃作為一個步驟,但最終生成的文件里有一個待辦清單,說明它是有規劃的。
執行過程中也確實搜索了圖片,但保存的很少,而且沒有一張圖片保存成功了。
導致最后輸出了一份純文字報告。
這個 Agent 目的不同,專注于設計,純粹作為對比,看看它能做出什么東西。
更多介紹:
完整效果見: https://www.lovart.ai/r/62cce51
設計 Agent 的思考方式就是不一樣,它完全把這個任務當成信息圖來看待了。
先找點視覺靈感,同時收集地質年代相關知識。
然后制定的執行計劃大概是:整理信息、生成 4 張圖片對應 4 個地質紀元、排版設計。
做出一個網頁長圖,它就交稿了。
這個測試里的知識(地質歷史)屬于容易找又不用推理的低難度信息。我隨意讀了幾處細節,發現各家知識基本正確,就沒有深度核查。我重點想考察的是,各個 Agent 在科普工作中能發揮多大用處,能不能把專業知識轉化成易于大眾理解的表現形式。
不同的 Agent 產品基因不一樣,做法也完全不同。偏重內容還是偏重表達,其實沒有好壞之分。這恰恰讓人認識到它們各自的長處,善加運用的話,的確能解決具體問題。
其中天工和 Lovart 脫離了文檔的層面,真的在用技術手段豐富內容展現形式。其實這種能力不是 Agent 工具專有的,AI 設計大佬 歸藏 很早就用提示詞實現了這種 AI 設計能力。或者反過來說,Agent 的這種設計能力,核心還是提示詞。
當然,如果玩不轉提示詞,用 Agent 工具也是很好的辦法,畢竟它們極大降低了使用門檻。而如果想對內容表現形式有更多定制化要求,好好打磨屬于自己的提示詞,然后在通用 AI 工具里也能實現,只是信息收集過程需要多一步單獨完成。
最后,來回答一開始的問題:AI 現在能獨立做 PPT 了嗎?
如果是做出一個可以在 PPT 軟件里打開的幻燈片文件,且內容可靠不空洞,不能。
但如果你自己有辦法確保內容的品質,AI 只是把內容轉成更易消化的視覺化形式,不限于 PPT 文件,那答案是:能。
復制本文鏈接 文章為作者獨立觀點不代表優設網立場,未經允許不得轉載。
發評論!每天贏獎品
點擊 登錄 后,在評論區留言,系統會隨機派送獎品
2012年成立至今,是國內備受歡迎的設計師平臺,提供獎品贊助 聯系我們
標志設計標準教程
已累計誕生 729 位幸運星
發表評論 為下方 6 條評論點贊,解鎖好運彩蛋
↓ 下方為您推薦了一些精彩有趣的文章熱評 ↓