五月天成人小说,中文字幕亚洲欧美专区,久久妇女,亚洲伊人久久大香线蕉综合,日日碰狠狠添天天爽超碰97

狂熱過后,我和幾位硬件工程師聊了聊 Manus 的價值和意義

關注
「即便最終贏家不是它,它也足夠意義重大?!挂晃?LAM 產品經理這樣評價 Manus AI 的行業(yè)價值。

編者按:本文來自微信公眾號 極客公園(ID:geekpark),作者:張勇毅,編輯:鄭玄,創(chuàng)業(yè)邦經授權轉載。

在昨天拿到 Manus AI 的測試碼、連續(xù)進行了數(shù)個小時的測試之后,有不少在手機/PC 廠商的工程師/產品經理朋友,來找我「打聽」Manus AI 的真正能力如何。

為什么硬件行業(yè)這么關注 Manus?這與當下硬件行業(yè)最受關注的概念——LAM 有關。LAM 是一個從 LLM 延伸而來的名詞,全名為大型行動模型 (Large Action Models),也稱為大型智能體模型。

與 LLM 致力于「超越人類」,因此在訓練方法上也經常突破人類經驗完全不同,現(xiàn)階段 LAM 想要做到的,是成為人類的手,去作為人類用戶在數(shù)字世界中的代理人。

這與 Manus 的核心理念有相通之處。目前而言,Manus AI 的體驗,圍繞在一個運行在云端的 Ubuntu 操作系統(tǒng)虛擬機上,同時在操作系統(tǒng)中打開 Chrome 瀏覽器界面,在網頁中或是調用其他軟件,來完成各種用戶的請求。

為了完成這個要求,Manus 需求同時具備「自然語義理解和計算機視覺」,以及「用戶行為習慣學習與場景感知」,同時擁有「意圖識別自主決策」的能力,當然最重要的,同時也是讓 Manus AI 與此前的 Computer Use 在體驗上拉開明顯差距的,還是「跨應用調用工具」的能力。

舉例來講,對于常見的「能不能用 Manus AI 生成一段視頻」這個問題,嚴格來講回答是「可以」,但 Manus AI 去生成一段視頻的方式,也是通過在網絡上搜索第三方 AI 視頻生成工具,并在這個過程中使用到各種工具,來完成用戶的請求。

01LAM 真正的未來

進入 2025 年,Agent AI,或者說 LAM 在端側的落地,已經是再明顯不過的趨勢。但怎么落地,以及最終呈現(xiàn)給用戶的會是怎樣的商業(yè)產品,仍然有很多問題。

早在 2024 年初,彼時發(fā)布的 Rabbit R1 硬件,以及對應的 LAM 工具——Rabbit LAM Playground 其實已經展現(xiàn)出了今天我們在 Manus AI 中看到的能力雛形。

在官方的演示中,Rabbit R1 所搭載的 LAM Playground,能主動幫助用戶完成類似音樂播放、打車等服務,實際上背后的技術原理,就是通過使用 LAM 來訪問對應服務的網站,通過模擬人類與網站的交互方式,完成用戶指令中的工作內容。

圖片

Rabbit 發(fā)布的 LAM Playground,其實已經具備今天 Manus AI 的初步能力 | 圖片來源:Rabbit

但彼時的 Rabbit Playground 受限于模型以及開發(fā)能力的限制,還并不能做到像人類一樣,在互聯(lián)網中暢通無阻。

在實際用戶的測試中,面對類似人機驗證這樣的場景 Rabbit Playground 仍然難以通過,也無法使用第三方工具,來完成生成復雜表格、導出 PPT 這樣的用戶需求。

由于在實際使用中面臨著諸多挑戰(zhàn),Rabbit R1 作為一款明星 AI 硬件,很快就退出主流用戶的視野,AI 時代的熱點變化的是如此之快,以至于到了 2025 年年初,在互聯(lián)網上已經很難找到關于這款產品討論的聲音。

但 LAM 這個概念,作為一個可能改變人類用戶與智能硬件設備交互的火種,留存了下來,仍然作為行業(yè)中一個重要的研究方向而存在。

Manus AI 的出現(xiàn),尤其是它在自然語義理解,以及在互聯(lián)網訪問網站時,面對各種各樣的人機識別,都能「暢行無阻」的能力,讓不少仍然在致力于 LAM 產品開發(fā)、并希望在今年推出相關測試產品的人,再次看到了一個契機,并希望通過 Manus AI 目前的能力以及展現(xiàn)出的短板,來進一步完善自己的產品。

圖片

Manus AI 已經能在遇到各種人機驗證時成功通過,大幅提升了對互聯(lián)網的訪問能力 | 圖片來源:極客公園

目前,在致力于開發(fā) LAM 產品、來提升用戶對手機/電腦等產品使用體驗的硬件廠商中,系統(tǒng)級廠商在做 LAM 中,有著最明顯的優(yōu)勢。

「Manus AI 這種命令執(zhí)行方式,對于算力要求非常高,但如果是瀏覽器或智能手機操作系統(tǒng)來做這件事,能通過獲得更多高質量數(shù)據(jù)的方式,大幅降低算力成本與提升運行速度」。

「做通用 LAM 并不用針對某些單一網站去適配,雖然在某些場景下可能」

Manus AI中的一些簡單的場景,并不需要完全搬到(云端)上面去處理,反而是留在端側效果會更好」據(jù)這位面向桌面端開發(fā) LAM 應用的開發(fā)者介紹,當前的端側模型經過針對性訓練之后,目前也能實現(xiàn)簡單的通用網頁訪問并內容識別能力,已經能初步完成例如「訪問旅游相關網站并制定旅游計劃」這樣的需求。

此外由于端側有著更便捷的文件管理系統(tǒng),同時也有更強大的本地文件管理工具,遇到類似「整理并分析簡歷」這樣的需求,端側 LAM 同樣能做到更好的效果。

在我的實際測試中,我想要讓 Manus AI 幫我生成一個 PPT 文件,它就能自動在電腦上安裝對應的依賴環(huán)境,然后利用工具來自動完成 PPT 生成,雖然最終仍然完成了用戶指令中的需求,但仍然因此大幅拉低了對請求的響應時間。

02如何理解 Manus 的意義

當前,Manus AI 展示出的邏輯中,已經向外界展示了 LAM 在「生產力」領域能帶來怎樣的改變,但仍然有很多問題亟待解答。

其中最重要的,也是被問到最多的,或許就是商業(yè)化這件事:不少用戶對于 Manus AI 這樣的服務,最終會定價多少有著諸多的猜測。

除了類似 Manus AI 這樣,完全交給云端運行,用戶端只需要「輸入命令 - 返回成果」的模式,前面提到的不少硬件廠商,實際上是將端側/云端混合運行的模式作為主流方案。

這其實也暗示了,未來 LAM 的發(fā)展,或許將分為兩個不同的主流方向;不僅有基于現(xiàn)有硬件算力,在端側實現(xiàn)性能稍差的 LAM,也有完全基于云端的「數(shù)字代理」服務。

但這樣的服務,距離最終投向市場可能還有不小的距離?!窶anus AI 如果訂閱的話,這樣的服務 20 美元(訂閱費)顯然是完全不夠的?!挂晃荒壳熬吐氂谑謾C廠商,研發(fā) LAM 端側應用的工程師對此評價道。

僅僅是全程虛擬機運行以及以及實時顯示內容串流的高昂成本,就足以成為此類服務現(xiàn)階段面向普通消費級市場的最大阻力。

對于以 ChatGPT 為代表的 LLM 產品來講,過去幾年已經迅速建立起一套行之有效的訂閱系統(tǒng),用戶也在「每個月 20 美元」的周期往復中,建立起了一個準確的心理預期。

如果 LAM 未來想要以這種「前端硬件 + 后端云服務」的方式繼續(xù)存在,同樣也要經歷這樣一個過程,同時在這個過程中將訂閱成本快速拉低,最終將這一商業(yè)模式跑通。

隨著完全在云端部署的 LAM 進一步完善,我們大概率會再次看到像 Rabbit R1 這樣、有著更靈活形態(tài)的 AI 硬件設備出現(xiàn):它可以是智能手表、也可以是 AI 眼鏡,甚至都可能是完全不需要屏幕的智能耳機等設備。

到這個階段,LAM 實際上已經進化成了 Agent UI:用戶并不再需要傳統(tǒng)手機桌面、瀏覽器那樣的用戶交互界面,只需要一個供用戶輸入指令的方式,以及接受 LAM 最終交付成果的終端。

圖片

當初 Rabbit R1 的展示場景中,就已經出現(xiàn)了一些 Manus AI 的案例 | 圖片來源:Rabbit

它或許不如 LLM 那樣科幻,但它卻是在現(xiàn)有硬件的基礎上,短期內我們能看到最明顯、最有能力給用戶與硬件的交互,帶來改變的方向。

隨著 Manus AI 進一步將 LAM 以及 Agent AI 能做到什么,展現(xiàn)給更多普通用戶,這或許就是 Manus AI 在這場浪潮最終退去之后,給我們留下的最重要的收獲。

「即便最終贏家不是它,它也足夠意義重大。」一位 LAM 產品經理這樣評價 Manus AI 的行業(yè)價值。

本文為專欄作者授權創(chuàng)業(yè)邦發(fā)表,版權歸原作者所有。文章系作者個人觀點,不代表創(chuàng)業(yè)邦立場,轉載請聯(lián)系原作者。如有任何疑問,請聯(lián)系editor@cyzone.cn。


反饋
聯(lián)系我們
推薦訂閱