所有語言
分享
原文來源:硅基研究室
作者:白嘉嘉
圖片來源:由無界 AI生成
近日,主打企業級Agent產品的AI創企斑頭雁智能科技收穫了近千萬美元的A輪融資。
Agent有「錢景」在業界已是共識。《產業家》的一組數據显示,截止2023年11月,Agent賽道發生融資事件13起,總融資金額約735億人民幣,公司融資均值為56.54億人民幣。
而在大洋彼岸,據知名AI記者Matt Schlicht的統計,至少有100個項目在將Agent商業化,近10萬名開發者正在構建Agent。
AI界迅速凝聚共識離不開大佬們的推波助瀾。
從去年6月OpenAI應用研究主管Lilian Weng提出Agent是AI應用層的發展方向,到11月比爾·蓋茨在博文中指出“誰能主宰個人助理Agent,那才是大事。因為你將永遠不去搜索網站,不去生產力網站,不去亞馬遜”,「大模型賦能千行百業」儼然已經升級成「Agent 賦能千行百業」。
近期由IDC、釘釘聯合發布的《2024 AIGC應用層十大趨勢》中同樣強調:“AI Agent是大模型落地業務場景的主流形式”。
為什麼Agent成為了科技圈的新共識?它的價值是什麼?科技弄潮兒又在它身上玩出了什麼花樣?從藍圖到現實,Agent距離我們的生活還有多遠?
將大模型應用於生產和生活的過程中,許多人都會碰到的一個問題是,不知道如何與這顆硅基大腦溝通。
對此,市面上甚至出現了許多教人使用大模型的課程。這些課程的重點,往往都圍繞着那些咒語般繁瑣的提示詞展開。
而Agent與大模型及其衍生產品相比,最突出的特點就在於,它不需要用戶輸入精準的提示詞(Prompt)。
放在和大模型交互當中,Agent相當於替用戶給出了一系列精準的提示詞。從用戶的視角出發,Agent和大模型在體感上的差別在於,Agent是掌握了一整套工作、思維方式,能主動完成信息抓取、分析和實操的老員工,而大模型只是需要人為反覆強調細節信息的新人。
將視角從用戶切換到企業身上。
卷了近一年大模型研發后,業界普遍認識到兩點。一是價格高昂的通用大模型在各行業中所能起到的助力有限。二是通用大模型很難打出差異,眼下各大廠商的產品在功能上都差不多。
因此,為了吸引用戶,尤其是更加務實的企業用戶為AI買單,必須把高成本、高門檻、泛用的大模型向小型、專業、便捷的方向發展。
用更通俗的話來說就是,大模型企業必須打造出一款便宜、上手門檻低,且能凸顯出自身差異的產品級AI應用,才能在市場競爭中生存下來。
而Agent正是這輪商業邏輯轉向的抓手。
與通用大模型的大力出奇迹不同,想要打造出「小而美」的Agent,背後的企業必須在研發之初就決定好應用的場景和領域。往往只有對某個行業足夠了解,才能覺察到其中的痛點環節。
譬如,近期發布AI Agent平台AskXBOT的瀾碼科技,為企業提供文檔檢索、AI調用、數據查詢、智能編程等基礎能力。這個平台的亮點在於它將各種模型能力都集成、封裝到了一款工作流設計器中,支持用戶使用「拖拉拽」的方式操作,定製AI工作流。
在「工作流」上下功夫的靈感來源於周健此前在PRA(機器流程自動化)廠商弘璣Cyclone擔任CTO的經驗。
RPA已經初步證明了用「拖拉拽」組件構建自動化辦公流程的市場需求,但周健發現,RPA的實操過程中,由於員工缺少專家的經驗,人和系統之前仍然存在操作的真空,比如業務流程到底是怎樣的——這塊知識的「空隙」仍需要人力去填充。
AI Agent的出現恰好可以彌合空隙。通過一個個AI工作流的建立,Agent既可獲得對業務的理解能力,同時可以可自主執行任務,還能隨着企業知識庫的不斷更新同步迭代。
某種程度上,「Knowhow、技術並重」是做好Agent的前提,開頭提到的斑頭雁智能科技的創始人張毅身上也能看到類似的特質。
張毅是原釘釘副總裁,任職期間,他曾用8年時間帶領團隊陸續打造出釘釘考勤、審批、智能人事、日誌、健康打卡等產品。此外,他還在阿里無線技術委員會、ToB產品委員會擔任委員。
Agent之所以成為創業者新的淘金地,也很好理解。一方面,在「大煉模型」階段,AI創企由於在算力和技術上處於劣勢,往往很難和BAT這樣的大廠進行競爭。另一方面,進入到Agent階段之後,研發者對行業的理解以及專業數據庫扮演起了更重要的角色,這恰恰是他們的優勢所在。
Agent的落地形式有兩種,一種是單體Agent,一種是群體Agent。
單體Agent的特點是以組件的形式嵌入傳統產業鏈當中去,針對顆粒度非常細的場景做優化。
比如高瓴創投投資的語音轉錄平台Airgram,推出了銷售場景下的會議Agent;成立於2021年的魔音智能的Agent,聚焦在私域運營和客服場景。而百度、滴滴、藍凌等大中型廠商,則針對企業的費控、數據分析、溝通等具體工作環節,分別推出了Agent方案。
這種做法的優點在於嵌入性、穩定性強,不會給企業運行帶來太多的動蕩。
對大型企業來說,除了要考慮未來的發展趨勢,維持當下的運行穩定同樣重要。因此,技術提供商給出的解決方案必須是開箱即用,能夠被快速整合到原先的運行體系中的產品。
這種方式也是業內的主流意見之一,360創始人周鴻禕就曾在公開場合中表達過,AI產品與傳統產業結合的路徑應該是最初以松耦合的方式嵌入業務鏈條,然後再隨着企業的智能化發展不斷向其他環節蔓延。
然而,並不是所有業務都可以被切分成孤立環節的,在這些業務中,直接打造一條Agent作業鏈會是更直接有效的解決方式,群體Agent也因此應運而生。
譬如,清華大學計算機科學與技術系副教授劉知遠成立的面壁智能,就把軟件開發平台ChatDev做成了一家只有Agent員工的軟件開發公司。CEO Agent負責接收用戶需求后,並把開發和交付任務分配給CTO、開發經理、產品經理、測試專員等Agent角色。
ChatDev平台本身也是一個群體Agent的經典案例。
雖然從形式上看,ChatDev只是一家開發AI聊天機器人的公司,但這些聊天機器人可以扮演各種專業角色並相互討論,直至給出一份完整的解決方案,包括源代碼、環境依賴和用戶手冊等等。
與單體Agent相比,群體Agent有望幫助企業迅速從無到有搭建起新的業務部門或直接兜售解決方案,並且,他們似乎具有一定的創造力。
火遍全球的群體Agent項目「斯坦福小鎮」就是一個典型案例。創作者在沙盒世界中放置了25個Agent,他們有自己的初始設定,彼此用自然語言對話。結果這些Agent之間的交互出現了人類意料之外的變化:Agent們自己創辦了派對,並且它們的人際關係變得更加複雜了。
就目前而言,除了少數幾家公司實驗性地推出了群體Agent,大多數企業的選擇都是從單體Agent出發。
對小企業而言,單體Agent路線的技術、算力門檻更低,從研發到形成商業閉環的速度更快。
但另一方面,單體Agent的競爭力高度依賴研發者對行業的理解以及背後的數據支撐,如果專業程度不夠深,沒有用戶買單繼而形成數據飛輪,就很容易成為大象腳邊的螞蟻。
去年11月GPT Builder在OpenAI的首次開發者大會上亮相后,許多Agent創企陷入了深度焦慮。究其原因就是很多企業只是套殼了Agent概念,沒有真正找到落地場景。
對大公司來說,由於旗下場景、算力、技術儲備都足夠豐富,在「All in AI」理念的推動下,已經在全流程推動AI替代或研發,單體Agent或群體Agent的路線選擇對它們來說並不重要。
有百度內部人士對「硅基研究室」透露,從2023年年初開始,李彥宏就已經要求內部養成AI思維,工作時保持思考能否將原先的業務用AI來做。
另一方面,群體Agent本身就是單體Agent的組合,雖然涉及到各業務串聯等問題,但在場景有限Agent開發邏輯中,完全可以謀定而後動。
在介紹Agent時,許多人都會用《鋼鐵俠》里的賈維斯舉例子,電影里最能體現Agent超越傳統意義上工具一幕,是史塔克每次去冒險之前,賈維斯都會詢問他要不要給波茲(史塔克的妻子)打個電話。
而在現實生活中,我們接觸到Agent最多的場景,可能是電話那頭的AI客服。從這個角度來說,藍圖和現實的距離就是我在電話這頭,你在電話那頭。
之所以會有這樣的落差也不難理解。最直觀的原因就是,大模型的複雜推理能力不夠強、延遲過高等問題抑制了Agent應用的真正成熟,這也是接下來業界工程優化和技術科研突破的方向。
但對大多數企業來說,更務實的着眼處是如何在現有的技術條件下,打造出真正能發揮生產力的Agent。
辦公協同軟件幾乎是國內Agent生長最肥沃的一片土壤,從WPS到釘釘、飛書、企微,都上線了相應的AI應用。究其原因,這些平台本身就具備良好的API接口和插件體系,這使得將大模型集成到現有工具中變得更加容易。
換而言之,在辦公協同領域,那些Knowhow已經被整理成了符合大家工作習慣的工具鏈,這條鏈條上鎚子、扳手、等工具都準備好了。並且,這個行業本身的數據規模就頗可觀,這是訓練出高質量輸出的Agent的基礎。
文首提到的張毅在介紹斑頭雁拳頭產品BetterYeah AI時也強調了類似的邏輯。
BetterYeah AI的一大優勢就是擁有整套自研RPA等超級自動化工具集,及Web Builder低代碼平台,可為Agent提供手和腳,在更多場景里使用,並大幅降低開發成本。
常被業內人士提及的另一個關鍵詞是調用Agent的成本。
雖然與大模型相比,Agent更貼近產業,也能讓客戶的每筆錢都花得更值,但不論是對客戶還是對開發商,Agent帶來的收益是否邁過了成本的門檻仍是未知數。
一個具體的例子是,斯坦福和谷歌聯合研究的Agent世界「西部世界小鎮」里,每個Agent的成本是20美元/時,比大多數人的時薪都要高。
算力是成本構成的大頭,但並非所有企業都有能力深入到算法環節進行優化,因此在交付環節下苦功可能會是更優選。譬如,可以提供一站式AI開發平台,或提供封裝好的Agent,幫助企業或單位以極低成本快速應用。
科大訊飛在推廣校園AI應用時就曾展示過對應開發平台,教師只需要通過自然語言輸入需求,平台便可自動生成應用。
最後,也是對買家影響最大的因素,是Agent的安全性和隱私性。
Agent商業化的基礎在於捕捉到了用戶的痛點環節,這也意味着這些環節往往能接觸到企業關鍵數據或信息。一旦Agent被攻擊,導致短暫停工或信息泄漏,就有可能造成用戶和社會蒙受巨大損失。
眼下GPT Builer面臨的一個問題就是,開發者發現第三者可以通過與GPT Builer的對話套出Agent的Prompt和上傳數據,知識產權無法得到有效保障。
立足當下,Agent無疑是傳統企業的又一次機會,得以繞過算力和技術的壁壘憑藉經驗再下一城。但同時也應該清晰地認識到,經驗有時候也會成為束縛,仍需要對行業範式的改變保持警惕。
畢竟馬車夫再怎麼鑽研給技術,也不可能跑得過汽車。
參考資料:
AI Agent,為什麼是AIGC最後的殺手鐧?| 騰訊研究院·
OpenAI打了個“響指”,AI Agent廠商重建護城河|36氪·
審視AI Agent:追捧、落地,和2024年的To B破局點 | 產業家
為什麼OpenAI下一步是Agent? 關於Agent你需要知道的一切 | AI新智能
原釘釘副總裁創業殺入AI Agent賽道,獲億元融資 | 36氪
2分鐘定製Agent,「瀾碼科技」發布企業級AI Agent平台AskXBOT | 36氪