所有語言
分享
作者 | 何思思
編輯 | 張 進
圖片來源:由無界 AI生成
“一定程度上,美國的算力禁用會造成國內大模型發展的限制,因為沒有核心算力就沒辦法訓練模型。”之於算力對於大模型的重要性,優刻得董事長兼CEO季昕華如是說。
自今年2月份大模型在國內火出圈后,算力瞬間成了業界最關注的話題,也成了國內大模型訓練很難攻克的關卡。其實從另一個角度分析,算力的爆髮式增長也給國內的雲計算廠商帶來了空前的發展機遇。
對此,季昕華也表示認同。他表示,算力禁用是壞事也是好事,一方面,如果想在一兩年內解決卡脖子的問題,需要加快國產芯片的研發速度,這並非一件易事;另一方面,企業越來越重視算力,這樣反而會推動國產芯片的發展。
作為中立的雲計算廠商,優刻得其實很早就感受到了大模型競爭的背後,算力市場將會迎來巨大的變化。
“去年11月份第一次接觸到Stable Diffusion,當時就覺得它的效果非常驚艷,所以就開始關注大模型了。”季昕華向雷峰網表明了關注大模型的緣由,同時他還透露道,由於當時中國企業還沒開始關注大模型,也不知道它到底能創造多大的價值,所以當時並沒有下定決心做大模型相關的業務。
而真正讓優刻得應用大模型和服務大模型企業要從今年2月份說起,這也是大模型在國內出圈的時間節點。
雷峰網了解到,優刻得首先基於大模型研發了知識問答平台“識問”、UCoder代碼助手平台,AI繪畫助手平台、大模型安全管理平台四款供內部使用的AI產品,其次,基於低成本、高附加值的自建數據中心,優刻得打造了AIGC算力底座,為大模型的訓練、推理、數據處理等靈活提供多款GPU算力資源。
緊接着,優刻得推出了私有化大模型一體機,內置優刻得自主研發的UCloudStack全棧私有雲平台,提供虛擬化、存儲、網絡及MaaS模型的私有化方案,結合行業垂直大模型一體化交付給客戶,企業可一鍵部署大模型應用。
之於優刻得在大模型時代的定位,季昕華再次強調了“中立”的原則。他解釋道,中立代表優刻得不僅和客戶之間沒有競爭,而且要幫助大模型公司找客戶。對此,季昕華還曾公開調侃道,大模型時代,優刻得要做的是“紅娘”。
從季昕華的回答中,我們也能間接得出優刻得內部研發、應用大模型產品的原因,一是為了公司員工了解大模型、學會使用大模型,在這基礎上,才能深入地了解大模型的痛點是什麼,具體能在哪些場景落地,這樣才能更好地為客戶提供服務。
談到大模型的未來,季昕華表示,未來具有太多不確定性,但不管怎樣,互聯網行業或者人工智能行業都是需要算力的,目前國內無論是單卡的訓練能力,還是卡之間的互聯能力都是有限的,所以優刻得未來的工作重點是把大模型算力底座搭建好。
以下是雷峰網和季昕華的對話:
雷峰網:很多人都在說最終能參与到大模型這場競爭的只有少數幾家雲廠商,像高速網絡就不是每家都有,您認為競爭的壁壘到底是什麼?
季昕華:是這樣的,像高速網絡這樣的技術並不是競爭大模型的主要門檻。包括優刻得及大多數雲廠商都有能力做。現在網絡有兩種結構:第一種是RoCE的網絡,這方面優刻得在 2019 年就已經有這個能力了。
第二種是IB網絡的方案,這是英偉達推薦的方案,這個方案相對來說更簡單,只需要部署和維護。所以對雲廠商或者體量特別大的公司來說,技術不是主要的門檻。
雷峰網:其實現在有說法說很多大模型企業都開始囤卡了?
季昕華:是的,尤其是一些大廠都在囤卡,包括A800、H800等。一方面自身的AI業務需要用到卡,加上有更多的資金投入,在此前就會購入大量的卡;另一方面,國內大範圍關注大模型是在今年的2月份開始,各個廠商因為重視,也會加快囤卡的速度。
雷峰網:那是不是擁有的卡越多就能躺贏?其他雲廠商怎麼和大廠競爭?
季昕華:也沒有躺贏,很多AI大模型公司現在也在用我們的卡,這種現象很普遍。
原因有幾個:第一,只用一家的卡是不夠的,第二,大模型公司為什麼願意和優刻得合作?是他們覺得大廠既有算力、算法,還有數據和場景,與大廠合作最終還是擔心會存在業務競爭。而優刻得作為中立安全的雲廠商,與大模型企業沒有競爭。同時優刻得能夠從數據中心、底層架構做到算力平台、模型庫等,具有深厚的技術積累和一站式系統工程服務能力。
雷峰網:優刻得是什麼時候開始關注大模型的?
季昕華:最早接觸是去年國慶的時候,首先看到的是Stable Diffusion,當時覺得它的效果非常驚艷,就開始關注了大模型了,所以ChatGPT的話我們跟進的比較早。
雷峰網:所以去年國慶的時候就下定決心要做這件事了?
季昕華:去年國慶之後,優刻得就把AIGC定為了今年的目標,去年11 月份還發布了AI繪畫平台鏡像。今年2月份和國內頭部的大模型公司交流之後察覺到國內算力市場將有一個爆發性的發展,所以在3月底下定決心要做這件事兒。
雷峰網:在這些做大模型的企業中,有多少潛在客戶?
季昕華:我們總結了中國做大模型的公司有130家了,通用的有78家,垂直的有52家。而且還在持續增加,其中有30多家已經是我們的客戶了。
雷峰網:具體以什麼樣的形式輸出服務?
季昕華:一是我們的算力,二是機房服務,因為有些公司是自己買設備然後放到我們的機房。
雷峰網:機房服務怎麼理解?是客戶本身沒有運營能力嗎?
季昕華:企業本身不管在哪都需要機房,大模型所需的機房有兩個特點:一是它的電量消耗大,二是比如一台 H100 的機器所需功耗超過10kW,一般機房是滿足不了這種需求的,優刻得的烏蘭察布數據中心就特別合適。另外,現在很多公司都存在有了服務器但用不起來的問題,那優刻得就可以幫助他們搭建一個算力平台並進行後續的維護工作。
雷峰網:除了提供算力外,優刻得前段時間還發布了“識問”?
季昕華:優刻得內部做了四個平台:知識問答平台“識問”、UCoder代碼助手平台,AI繪畫助手平台、大模型安全管理平台。其實在“識問”之前,最早我們首先做的是大模型應用管理系統,這是我們的第一款產品,希望未來所有人都能夠用上大模型;
第二為了解決商業安全問題,我們做了一些限制,包括你的提問、上傳的文件,我們都會記錄和過濾,防止公司機密信息在網絡上泄露;
第三針對用戶的問題,包括員工內部的問題和外部的溝通和返回,系統會做自動記錄,方便後期公司持續進行自己的模型訓練。
雷峰網:為什麼做這四款產品?能對外嗎?
季昕華:一是為了公司員工都能了解大模型、使用大模型,在這基礎上,才能深入明白大模型公司的痛點是什麼、具體在哪些場景落地,這樣才能更好地為客戶提供服務。
這四款產品目前是公司內部使用的,但是如果客戶有需要的話,我們也可以進行更多交流。
雷峰網:那這幾個平台是基於哪個模型做訓練的?
季昕華:先用 GPT 4 訓練,進行模型驗證,走通后逐步再用國內的大模型或者開源大模型去優化。對此我還提了一個概念叫“國外磨槍、國內戰鬥”。
雷峰網:未來還有哪些場景是您比較看好的?
季昕華:如果按照對ChatGPT輸出內容不準確定性的容忍度來區分的話,我們劃分了10個場景。
第一是翻譯和配音,在這方面的能力已經非常高了,完全可以取代人類;第二是遊戲的NPC;第三是社交;第四是電商的內容輸出;第五是遊戲設計;第六是客服;第七是公文和編程的輔助;第八是企業內部的知識管理,第九是教育場景和保險場景,最後是輔助律師和醫生的工作。
雷峰網:這10個場景會同時做嗎?還是逐步推進?
季昕華:優刻得不做大模型,我們只是把客戶和合作方對接起來,可以理解為“紅娘”的角色。比如把遊戲客戶對接給MiniMax、把電商、教育行業的客戶對接給智譜華章。
雷峰網:您認為國內大模型公司可以分為幾類?哪些是優刻得的重點客戶?
季昕華:我們分為五大類。第一類是巨頭,包括阿里、百度、頭條,華為、京東等。第二類是科學家創業的,像智譜華章這類公司;第三類是原來的AI公司、AI 四小龍、達觀、雲知聲、第四範式等;第四類是創業公司,像MiniMax;第五類是原來的上市企業轉行做大模型的,像崑崙、360,也包括王小川、李開復這些創業大佬等。
第一類大廠不是優刻得的目標客戶,後面幾類才是我們的重點客戶。
雷峰網:也就是說大廠有自建能力,其他企業是沒有自建能力的?
季昕華:因為涉及到人工智能領域,所以不僅是網絡問題,還有存儲、機房等一系列問題,例如創業公司也可以自建算力,但周期會很長,等他自建好之後,競爭就結束了。大模型比拼的就是速度,誰速度快,誰就有可能佔領制高點。
雷峰網:對於大廠說,大模型分為幾個階段,幾個節點?
季昕華:第一是大模型上線,第二是上線後效果的驗證。目前了解到上線的有MiniMax、智譜、百度、阿里、科大訊飛等公司。
雷峰網:哪家的效果好,主要看算力用的多少嗎?
季昕華:我不這麼認為,訓練用的算力多不一定能訓練出好的模型,但如果推理環節卡用的多的話,說明用戶量大,得到的反饋也就更多,更有利於訓練出好的模型。
雷峰網:不管訓練還是推理,做大模型首先還要有算力的?
季昕華:對,第一要有卡,如果沒卡的話肯定是落後的;第二要具備很強的工程能力,有了卡用不起來也不行,目前各家的工程能力發揮都在40-50%左右。以上兩個問題都解決了,就是安全問題了,另外流量問題也很重要。
雷峰網:國內模型到什麼水平了?很多人說今年年底能追上GPT4。
季昕華:目前國內還沒有出現超過GPT3.5的模型,當然在某個方面超過其實很容易。超越GPT4的話很難,關鍵在於GPT3.5之前的論文是公開的,但是GPT4還沒有公開,所以大家都不知道該怎麼做。
雷峰網:國內這些大廠也沒有機會趕超嗎?
季昕華:我覺得現在大廠的效果都不如創業公司。因為有些有信念、有理想的創業公司早就開始做了,大廠實際上是看到ChatGPT火了之後才做的。
雷峰網:按理來說大廠有技術積累,不更有機會嗎?
季昕華:AI有很多方向,以前大部分企業都認為垂直大模型有機會,不認為通用大模型有機會,所以過去幾年真正做通用大模型的反而是一些有信念的創業團隊和科研團隊,比如智譜華章、MiniMax,中科院等。
那對大廠來說,更多的是看到國外在做這件事後進行跟進,並沒有上升到公司戰略,因此他們在通用大模型方面並沒有特別多的積累。
雷峰網:算力問題遲早會解決,那優刻得在大模型方面的優勢是什麼?
季昕華:總結為三點:第一保持中立性,和用戶是沒有競爭關係的。第二具備數據中心、網絡以及數據存儲的一整套AIGC解決方案構建能力,能幫助中小型公司快速搭建平台,解決使用大模型的效率問題;第三能更好地幫助大模型公司拓展客戶。