所有語言
分享
AI 新智界訊,1 月 5 日,“智求共贏・中國 AIGC 產業應用峰會暨無界 AI 生態合作夥伴大會”在杭州未來科技城召開。大會由杭州未來科技城管委會、餘杭區科技局和餘杭區企業(人才)綜合服務中心聯合指導,時戳科技主辦,AI 新智界提供媒體特別支持。華為 EI 人工智能產品線副總裁李偉在會上圍繞《昇騰雲服務,服務百模千態——構建 AIGC 的黑土地》主題發表了演講。
他表示,人工智能基礎設施是新基建的核心任務,也是数字經濟發展的基礎設施。目前,大模型正推動 AI 從“作坊式”轉向“工業化”。他強調,作坊式 AI 是不同場景對應不同小模型,分析數據給出建議,替代低端重複性工作物體識別和分析,但是小模型存在模型泛化的問題。工業化 AI 則是利用大模型吸收海量知識,適配多業務場景,並且解決了模型泛化性問題。另外,他還表示,算力已經成為新型生產力,打造對等的多元算力勢在必行。
以下是 AI 新智界整理的演講內容,為方便閱讀已進行部分刪減:
首先我先介紹一下自己。我們是華為雲,內部叫作 EI。EI 包含了三部分內容:昇騰雲服務,大模型以及大數據。大模型是盤古大模型,也包括開源大模型的能力適配。大數據在 AI 時代就是 AI for Data、Data for AI。其中昇騰雲服務是把我們的大模型能力、AI 大數據能力全部沉澱到数字世界的統一載體。
在過去兩年中,國家陸陸續續出台了一系列人工智能政策,從傳統的数字化到智能化,不管是工信部、科技部,還是六部委、七部委。於企業而言,國家政策支持,是企業創業的一個前提條件。
為什麼大模型會火起來?其實我們一直在做 AI。以前 AI 時代更多是一些小模型,比如視頻監控,在一個場景裡頭識別物體、識別人,比如城市檢測的垃圾識別有很多小場景,都由小模型完成。但是小模型有巨大的問題,就是模型泛化,在不同場景下解決模型泛化非常困難,場景一變,攝像頭一變,模型和算法就要不斷去適配。
在大模型時代,企業做到了知識能力的統一沉澱,泛化性問題得到了很好的解決。實際上,大模型時代是將人類知識做了很好的預訓練,在預訓練里做模型的微調。我們從最開始的模型到 Prompt、再到 Agent,一層層不斷沉澱。這時候通過預訓練的大模型,已經能夠很好地解決多個場景用一個模型來適配,以及模型泛化性問題。
華為在去年 7 月的時候發布了盤古大模型。盤古大模型分為幾個基礎大模型,自然語言大模型、盤古大模態大模型、視覺大模型、預測大模型以及科學計算大模型。每一個大模型場景,都專註於解決一類的問題。通過五個大模型基礎能力的研發和設置,我們又把它分成三層,稱之為“5+N+X”,“5”就是我們的五個基模型,N 就是 L1 的行業模型,我們希望在每個行業里都能沉澱自己的行業大模型,同時針對行業大模型來構建每個行業的應用場景。
在這個過程中,從我們的實踐經驗來看,對於業界尤其是產業界而言,未來對基礎模型這一塊的投入研發非常具有挑戰性。一個大模型本質上來講是三個能力:一是數據,二是算力,三是模型。從模型來看,它是一個知識非常密集型的產業,同時它在算力上的需求非常巨大。根據 ChatGPT 公開的數據,訓練一個基礎模型,每次訓練(例如 GPT-3.5)基本上都是 1200 多萬美金,並且訓練是不斷迭代的,模型的參數將會越來越大。
而數據獲取並不是關鍵,獲取到數據以後怎麼樣做數據清洗、數據治理才是關鍵所在。在行業中,每個行業將來都會有自己的行業模型出現,這就跟我們培養一個本科生一樣,如果把大模型類比成一個學生,可能在某個場景中我們培養了一個本科生,但在將來一定會出現各個行業的研究生,各個場景的博士生,它們會專註去做一件事情,並且事情做到極致、做到最好。
從這一點來講,L1、L2 這一塊的架構同樣是非常開放的,能夠支持所有的合作夥伴、創業公司能在我們的盤古大模型和昇騰雲服務上進行適配和開發。
在政務場景裡頭,華為抓住了政務服務、政務城市治理、政務辦公等業務痛點。比如政務辦公裡頭的文生圖、文檔摘要等業務痛點,整個視頻監控裡頭的交通監控、城市危險識別、垃圾識別等等圍繞城市治理的場景。在金融場景中,華為讓每個員工都擁有專家助手,做到了複雜業務簡單辦理。我們認為,未來不管是面向政府也好,金融場景也好,本質還是要解決客戶實際生產中遇到的痛點和問題,這樣才能進行真正的商業閉環。
在做所有工作的過程中,華為也沉澱了非常多的能力。這些能力,一方面會沉澱到基礎模型;另一方面,則會沉澱到工具鏈上。首先是圍繞大模型的工具鏈。我們知道模型在訓練過程中需要對數據進行治理和清洗,因此華為在數據工程方面積累了很多經驗。同時,對模型方面有模型工程,不管你是做 Prompt 還是 SFT,還是做其他模型的調優,都需要基於模型的工程能力。
其次,在傳統的 AI 能力上,華為也有通用 AI 開發工具鏈,包括數據預標註、數據處理、模型訓練、模型推理。最後是算力調優工具鏈,背後的邏輯是算力連續性問題。現在業內真正卷大模型,不管是卷 NLP(專業分析人類語言的人工智能),還是卷 AIGC、卷文生圖、圖生文的大模型場景的時候,你會發現算力的問題一定是要長期考慮的。
目前,業界主流的 AIGC 公司都已經在華為昇騰雲服務上進行適配和調優。在此,我簡單地將華為提供的工程能力、工具能力做了演示,主要是圍繞模型開發,包括數據工程、模型開發、應用開發、測試,這些服務都在昇騰雲服務上提供,並且支持公有雲模式和私有雲模式。
除此以外,我們提供昇騰雲算力。例如,目前在貴安,華為已經建立了將近 7 萬台以上的算力集群,將充足的算力提供給大模型各個廠家。另外,華為昇騰雲還將工具和能力提供給所有的開源模型,並支持主流的開源模型,不管是開源模型的 LLaMA、GLM,還是多模態的 SD,還是第三方的星火、百川大模型。這麼做能夠幫助創業公司在昇騰雲服務上快速構建其場景和能力。
而在數據層面,用戶最關心的是數據的安全和保護的問題。在這個方面,華為對客戶的數據安全隱私保護做到了極致。這體現在資源專屬和數據主權上,包括數據在訓練和推理過程中的保護。在整個全流程的可追溯、可控,以及專業化的安全方案上,華為都做了充足的準備和方案。
上述是我們承載的應用能力的展現。不管是開源模型,如 LLaMa、LLaMA 的 6B、7B、13B 等模型,還是其他的 GLM-6B 模型,昇騰雲都會提供支持。
整體來講,我們也希望所有的創業公司、所有夥伴都能夠圍繞開源模型,基於開源模型、盤古大模型,匯聚到昇騰雲服務上。我們認為,華為未來 toC 場景一定會出現一些超級應用;對於 toB 場景,可能機會更多。