所有語言
分享
圖片來源:由無界 AI 生成
“我們寧可100%解決客戶的一個問題,也不要70%-80%地解決客戶的100個問題。”
7月7日,2023年世界人工智能大會(WAIC)騰訊論壇上,當被問及先推出面向行業的大模型原因,時,騰訊雲副總裁、騰訊雲智能負責人吳運聲如此回復。
大模型是今年AI界,當之無愧最火的話題。對比百度、阿里等巨頭先推出底層的通用大模型,騰訊把眼光直接聚焦到產業中——在WAIC舉辦前,6月19日,騰訊雲正式公布MaaS(模型即服務)全景圖,目前已為10大行業輸出了超過50個解決方案,涵蓋文旅、金融、傳媒、教育、政務等多個不同場景。
自然而然地,場景應用和落地成為貫穿整場WAIC騰訊論壇的主題。
“通用大模型不是模型應用的唯一方向,面向垂直產業的模型,會成為大模型價值的引爆點。”騰訊副總裁、騰訊政企業務總裁李強在論壇上如此預測。
吳運聲以OTA(在線旅行社)智能客服為例,解釋到,用戶在實際交流過程中,往往是多個意圖混雜的。交流的過程中,意圖也可能隨時進行切換。
“(用戶)剛提出要定10號的酒店,機器正準備回答,突然又說,再幫我看看11號的酒店。”面對客服場景下極其複雜的流程,通用大模型並不能完美地完成任務,因此必須結合具體場景,重構一些複雜的模型。
但當前通用大模型尚在研發初期,在行業應用會要面臨成本高昂的問題,吳運聲則表示,在一些具體場景里,通用大模型既然不能100%滿足需求,那麼“判斷解決成本的高低,沒有太大意義”。而儘管不同行業和場景的解決方案會有很大差別,但總體而言提升企業30%以上的效率,沒有問題。
騰訊雲副總裁、騰訊雲智能負責人吳運聲。來源:騰訊
論壇上,騰訊雲也介紹了近期圍繞大模型的重要升級。其兩大技術底座——星脈網絡、向量數據庫都進行了能力升級。升級后的星脈高性能計算網絡,可以提升GPU利用率的40%,節省模型訓練成本的30%-60%,提升AI大模型的通信性能近10倍。
而就在7月4日,騰訊雲正式發布AI原生向量數據庫,相比傳統方式,將其用於大模型預訓練數據的分類、去重和清洗,數據庫可以實現10倍效率的提升。將其作為外部知識庫用於模型推理,則可以將成本降低2-4個數量級。
今年的WAIC上,也出現了一個有趣的現象:會上30多款通用、行業大模型齊齊亮相,都說要做大模型。同質化問題隨即成為討論焦點:如今AI領域的創業是否還有意義?各個大廠都有自己的大模型,人有我有的前提下,大模型是否還會是Game Changer?
吳運聲認為,在大模型發展的初期,不需要對這些問題急於發表論斷。“我更希望看到,在行業百花齊放的階段,通過技術和產業的結合,探索各種各樣的可能性,提升產業和行業的效率。”吳運聲表示。
這種判斷,也來自他對AI大模型商業潛力的樂觀。在上一波單點突破的AI浪潮中,許多AI企業陷入做項目、做私有化的交付實施困境中,無法實現盈利。
“在大模型時代,情況或許會和之前有所不同。”吳運聲認為,隨着技術的發展,包括底層算力、GPU芯片等的發展,以往動輒千億的模型參數正在越來越小;騰訊在訓練加固、推理加固上也有許多進展,成本正在快速下降。另一方面,大模型應用方面的可能性正在不斷拓展,價值正在不斷上升。
如今,騰訊正在圍繞AI大模型拓展技術和應用生態,也在加強與行業的聯動。7月6日,聯合國工業發展組織與華為等合作夥伴在WAIC上,共同宣布成立“全球工業和製造業人工智能聯盟”。
吳運聲同時也強調,技術底座的升級,是“修鍊內功”:“不管通用大模型,還是行業大模型,都需要有底層的支撐能力,包括巨大的算力、數據等等。”
“大模型時代,開放非常重要,所有人都要開放。底層技術變化太快,外延能力非常廣,結合到具體行業中,有大量的研發成本。”吳運聲表示,只有通過開放,讓更多行業專家、各類人員加入,才能培養起更健康的生態體系,產生更多可能。
媒體:騰訊雲一開始推出了面向行業的大模型,而不是通用大模型,是不是收入的考量?
吳運聲:這和成本、投入沒什麼關係。我們一直強調希望解決客戶的問題,寧可100%解決客戶的一個問題,也不要70%-80%地解決客戶的100個問題。我們可以把問題做得少,但一定要解決這個問題。
媒體:聽上去通用大模型和行業模型有對立的感覺,您怎麼看兩者之間未來的關係?
吳運聲:首先,我要明確,我個人肯定沒有將兩者對立起來。基礎大模型是類似底座的東西,可以解決沒有特別定製的需求。行業模型要在通用大模型基礎上,有效地提高生產力,為大眾服務。只有深入行業,才能解決特別重要的問題。
文生圖功能也會有非常細節和具體的行業之分——就比如針對一款包生成廣告圖,也會有客戶有特別需求,比如要做一些特別的認證。面對實際問題時,要用不同的方式進行。
媒體:騰訊今年將聚焦哪些領域,有哪些發展目標?最近有哪些升級和迭代?
吳運聲:我們的大策略是專註於實際問題的落地,希望在每個特定場景里,100%解決客戶問題,而不是找100個產品解決70%-80%的問題。所以,我們會聚焦特定行業,與客戶深入打磨,來解決行業問題。
比如,在文旅行業,OTA(在線旅行社)領域的客戶,會結合自身業務場景,在業務流程中運用大模型技術,並利用數據相關資源對大模型進行精調。在技術發展方面,我們的模型、算力網絡都有迭代和升級,我們也會持續迭代相關技術。
媒體:上次發布產業大模型到現在,接入大模型的企業數量有明顯變化嗎?
吳運聲:和我們接觸公司確實非常多,我們會很坦誠地研究客戶實際的場景,以及如何滿足當前的業務需求。“接入”這件事情沒有特別明確的定義,探索過程中有各種各樣的需求,可能大家平時見的比較多是AIGC。
我說點稍微不一樣的。我們有一家做企業級軟件的公司客戶,需要製作智能表單。比如管理層開會,新增一個表單,表單下面的項有些必填,有些不必填,有些下拉只能選4、5個選項。選項完成后,要把它變成一個流程,經過A、B、C三人審批,每個人審批的方面不太一樣。
原先的做法是,在系統里把表單用自己的工具和語言代碼設計出來,編出整個流程,再調用內部機構實現流程。而現在的需求是,拍張照片放到系統里,用系統的代碼(自己的腳本語言)描述出來,個人只需要簡單的自然語言交流和溝通,比如哪些必填,哪些不必填,第一步到哪,第二步到哪,用自己系統的語言設計對接流程。
這個例子是非常具體的需求,通用大模型無法完全解決。所以,我們就會和企業深入交流,要看錶格大概是什麼字段,腳本語言是什麼。通用技術可能可以直接解決60%-70%的問題,但是客戶要的是100%解決問題,就需要更多深入交流。
媒體:行業大模型的落地,將為企業節約多少成本?與通用大模型相比,行業大模型在哪些領域會有優勢?
吳運聲:節省的成本,其實在不同的企業、不同的場景里有很大區別。舉個例子,在客服場景里,客服本身在企業佔多大規模,有多少預算,都有很大區別。從實際感受來說,我覺得提升30%以上的效率是沒有問題的。
通用大模型在面對具體行業時,不一定能徹底解決行業遇到的問題。比如,客服需要的不是簡單的問答聊天,而是機器人、大模型能夠理解人類意圖,檢索數據庫,提取所需信息,再組合成人類可理解的文字進行回復。
最關鍵的是,用戶實際交流過程,往往是多個意圖混雜的,一個描述里有很多需求,交流過程時意圖可能隨時切換,難度很大,流程非常複雜,尤其是與客戶的系統交互有非常複雜的模型。這個流程一定不是通用大模型能解決的,需要結合具體場景。
媒體:騰訊能把企業大模型成本控制在怎樣的範圍內?
吳運聲:我們強調通過這個技術,使企業降本增效、提高生產效率,但我們一定不會說把成本控制在什麼水平。我們產品發布還不到一個月,前期有一些合作,但肯定給不出整體性的數據。
36氪:上一波AI浪潮里,是以CV(圖像識別)為首的技術應用,應用更偏單點,比如調用api計費,但做到後面,公司都開始做項目、做私有化,導致盈利艱難。未來,AI大模型會經歷一樣的事情嗎?
吳運聲:我還是持樂觀一點的態度,從現在的時間節點看,會有比較大的挑戰。但不管往前看半年,還是往後預測半年,技術的發展非常快,包括底層算力、GPU芯片。大模型以前動不動千億參數模型,但隨着技術發展,模型參數越來越小,能力還是維持在很強的水平。同時,我們在訓練加固、推理加固上有非常多進展,成本正在快速下降中。
另一方面,在應用上,我們看到更多的可能性,在應用和所能產生的價值趨勢是不斷上升的。
媒體:怎麼看待底層能力建設與場景落地方面之間的平衡?
吳運聲:我們一直不希望以單一的視角看待大模型。不管通用大模型,還是行業大模型,都需要底層的支撐能力,包括巨大的算力、數據等等,這是內功的維度。而場景是另一個維度,解決一個實際問題,用五成的內功,另外三成外功,再加另外兩成,在大模型生態里,我們是從不同的視野看待問題。但是如果純講內功,肯定也沒有問題。
媒體:很多CEO提過,大模型對計算行業是game changer。現在所有大廠都推出大模型,這個判斷是不是不成立了?我們需要這麼多通用大模型嗎,是否已經冗餘了?
吳運聲:看怎麼定義game changer。現階段來看,大模型行業處於比較初級的階段,誕生了非常多可能性。同時,我們看到大模型帶來技術的變革,潛力非常大。
我個人的觀點是,現在不需要太急於發表論斷,我更希望看到,在行業百花齊放的階段,通過技術和產業的結合,探索各種各樣的可能性,提升產業和行業的效率。
媒體:模型與行業結合處於早期階段,這個階段當中會存在哪些問題?有觀點認為,行業大模型相比通用大模型,未必在成本上有所優化,可能反而更高,怎麼看這個觀點?
吳運聲:大模型技術出現的時間還很短,在快速發展中。行業對大模型的理解,也在早期階段——不知道大模型能幹什麼,能與行業結合到什麼深度。行業大模型和基礎大模型的關係、成本的問題,確實都存在變化。
確實有觀點認為,一個大模型如果解決所有問題,成本會更低,也有觀點認為針對某個行業,不需要大模型,用小的模型就可以。
這個問題不能用單一維度判斷,要客觀完整地看待這個問題。我一直在強調,通用大模型可以解決通用的、與行業結合併不緊密的問題。但如果要再深入的話,就要在場景上進一步深化了。許多問題看上去是一樣的,但深糾下去也許解決的不是同樣的問題。這種情況下,判斷解決的成本高低,沒有太大的意義。
媒體:從行業的角度,怎麼判斷大模型技術變革對整個雲計算市場帶來的市場增量,和增量場景?
吳運聲:可以看到,大模型時代來臨后,對算力需求有非常大的推動,尤其是對於AI相關的算力。但在雲計算的具體量化上,很難給出数字,還在持續發展過程中。
場景上,現在各行各業都在結合大模型,場景很豐富,既有通用場景,也有行業場景。通用的場景包括會議智能升級的工作,騰訊619發布的企點客服、企點分析,也在做智能工作,我們也做一些雲上代碼助手。在普世應用上,效率升級上,也有非常多應用。另外,各行業有各行業的應用,也會帶來大量需求。
媒體:除了大模型落地場景側之外,騰訊會不會為其他的大模型企業提供服務?火山引擎說七成大模型用戶在火山,騰訊的數據是怎樣的?
吳運聲:我們對獨角獸企業,或是其他大模型的方案,提供一系列的雲的支持或能力。我們發布了高性能計算機HCC、向量數據庫,提高了加速能力,這些都可以提供給廠商。
除了底層能力,我們還有一體化的基於TI平台大模型精調的解決方案,也有一系列的工具、流程和服務的支持。
媒體:很多SaaS服務商沉澱了很多年,我們的MaaS(模型即服務)是面向他們,還是面向頭部的行業客戶?
吳運聲:這些都是我們的客戶。
媒體:與產業結合,是目前騰訊的打法,打不過就加入大企業的生態。昨天華為成立了聯盟,是不是意味着競爭更容易形成巨頭間的較量?
吳運聲:我倒不這樣看待這個問題。我覺得大模型時代,開放非常重要,所有人都要開放。底層技術變化太快,而且技術的外延能力非常廣,結合到具體行業中,有大量的花費。這種情況下,只有開放才能發揮最大的價值,通過開放讓更多行業專家、各類角色人員加入,才能讓整個生態體系更加健康,產生更多可能。
媒體:對每個公司的開放是一樣的嗎?
吳運聲:我說的開放是指能力建設上,還有生態的開放。比如建設金融大模型,不是一個人概括所有的金融大模型,不同人在不同領域有很深的經驗,一起共建是一種開放。直接對行業客戶開放,也是一種開放。
另外,合作夥伴基於大模型提供的能力,做效率工具的應用升級,或是行業解決方案的升級,不同形態的應用聯合在一起。在大模型內功方面加強,合作夥伴百花齊放,大家呈現不同的應用,這也是一種開放。