所有語言
分享
原文:騰訊科技
過去幾年,Facebook母公司Meta在元宇宙上投入巨資,並不斷致力於相關硬件和軟件的開發,甚至可能為此忽略了人工智能領域的最新趨勢。但隨着生成式人工智能爆火,Meta似乎重新調整了公司方向,開始在人工智能領域發力。美國當地時間周四,Meta發布了兩款用於人工智能的自研芯片,並透露了其在人工智能超算方面取得的最新進展。
在周四的虛擬活動中,Meta展示了其為人工智能工作負載開發的內部基礎設施,包括支持運行生成式人工智能,該公司在新推出的廣告設計和創作工具中都集成了這種新技術。這是Meta展示實力的一次嘗試。此前,該公司在採用對人工智能友好的硬件系統方面始終行動遲緩,這削弱了其與谷歌和微軟等競爭對手保持同步的能力。
Meta負責基礎設施的副總裁亞歷克西斯·比約林說:“建立我們自己的硬件能力,使我們能夠控制從數據中心設計到培訓框架的每一層堆棧。這種水平的垂直整合是推動人工智能研究向前發展的必要條件。”
在過去十年左右的時間里,Meta花費了數十億美元招募頂級數據科學家,並構建了新型人工智能,包括現在為其應用和服務中的發現引擎、審核過濾器和廣告推薦提供支持的人工智能。但該公司始終難以將許多雄心勃勃的人工智能研究創新轉化為產品,尤其是在生成式人工智能方面。
直到2022年,Meta才通過使用CPU和為加速人工智能算法而設計的定製芯片來運行其人工智能工作負載。但Meta取消了原計劃於2022年大規模推出的定製芯片,因為這需要對其幾個數據中心進行重大重新設計,它轉而訂購了價值數十億美元的英偉達GPU。
為了扭轉局面,Meta計劃開始開發一種更雄心勃勃的內部芯片,並定於2025年推出。這種芯片能夠用於訓練人工智能模型,也能支持運行它們。
Meta將這款新芯片稱為Meta訓練和推理加速器,簡稱MTIA,並將其歸類為加速人工智能訓練和推理工作負載的“芯片家族”。“推理”指的是運行某個經過訓練的模型。MTIA是一種專用集成電路(ASIC),即將不同電路組合在一塊電路板上的芯片,允許被編程以并行執行一個或多個任務。
圖1:為人工智能工作負載定製的人工智能芯片
比約林繼續說道:“為了在我們的重要工作負載中獲得更好的效率和性能,我們需要一個與模型、軟件堆棧和系統硬件共同設計的定製解決方案。這為我們的用戶在各種服務上提供了更好的體驗。”
定製人工智能芯片越來越成為大型科技公司的主打產品。谷歌開發了一種處理器TPU(張量處理單元),用於訓練PaLM-2和Imagen等大型生成式人工智能系統。亞馬遜向AWS客戶提供專有芯片,用於培訓(Trainium)和推理(Inferentia)。據報道,微軟正在與AMD合作開發一款名為“雅典娜”的內部人工智能芯片。
Meta表示,該公司在2020年開發了第一代MTIA(MTIA v1),並使用7納米工藝生產。它可以從128 MB的內存擴展到128 GB,在Meta設計的基準測試中,Meta聲稱MTIA能比GPU更有效地處理“低複雜度”和“中複雜度”的人工智能模型。
Meta表示,在芯片內存和網絡領域仍有很多工作要做,隨着人工智能模型規模的增長,這些領域都還存在瓶頸,需要將工作負載分散到多個芯片上。令人覺得巧合的是,Meta最近收購了英國芯片獨角獸Graphcore位於奧斯陸的人工智能網絡技術團隊。就目前而言,MTIA的重點是針對Meta應用系列的“推薦工作量”上進行嚴格的推理,而不是培訓。
但Meta強調,在運行推薦工作負載時,不斷改進的MTIA“大大”提高了公司的效率,從而使Meta能夠運行“更多增強”和“尖端”的人工智能工作負載。
也許將來有一天,Meta會將其大部分人工智能工作負載交給MTIA負責。但目前,這家社交網絡巨頭依靠的是其專註於研究的超級計算機Research SuperCluster。
Research SuperCluster於2022年1月首次亮相,由企鵝計算、英偉達和Pure Storage合作組裝,目前已經完成了第二階段的建設。Meta表示,Research SuperCluster現在總共包含2000個英偉達DGX A100系統,配備16000個英偉達A100 GPU。
那麼,Meta為什麼要在內部建造超級計算機呢?首先,這裡有其他科技巨頭帶來的壓力。幾年前,微軟對其與OpenAI合作開發的人工智能超級計算機進行了大肆宣傳,最近又表示將與英偉達合作,在Azure雲上構建新的人工智能超級計算機。同時,谷歌也在吹捧自己的人工智能超級計算機,該計算機擁有26000個英偉達H100 GPU,遠遠超過Meta的超算。
圖2:Meta公司用於人工智能研究的超級計算機
但Meta表示,除了保持與其他同行同步,Research SuperCluster還允許其研究人員使用Meta系統中的現實世界示例來訓練模型。這與該公司之前的人工智能基礎設施不同,後者只能利用開源和公開可用的數據集。
Meta發言人表示:“Research SuperCluster人工智能超級計算機用於推動人工智能研究在幾個領域的發展,包括生成式人工智能。這實際上與人工智能研究的工作效率息息相關。我們希望為人工智能研究人員提供最先進的基礎設施,使他們能夠開發模型,併為他們提供一個促進人工智能發展的培訓平台。”
在其巔峰時期,Research SuperCluster的計算能力可以達到5 exaflop,Meta聲稱這是世界上最快的計算機之一。Meta表示,它使用Research SuperCluster來訓練大語言模型LLaMA。今年早些時候,Meta向研究人員開放了“封閉發布”的大語言模型訪問權限。Meta說,最大的LLaMA模型在2048個A100 GPU上進行了訓練,耗時21天。
Meta發言人稱:“Research SuperCluster將幫助Meta的人工智能研究人員建立新的、更好的人工智能模型,這些模型可以從數萬億個例子中學習,工作跨越數百種不同的語言,無縫地分析文本、圖像和視頻,以及開發新的增強現實工具等。”
除了MTIA, Meta還在開發另一種芯片來處理特定類型的計算工作負載。這款芯片被稱為Meta可擴展視頻處理器,簡稱MSVP,它是Meta內部開發的第一個專用集成電路(ASIC)解決方案,專為應對視頻點播和流播的處理需求而設計。
有些人可能還記得,Meta多年前就開始構思定製的服務器端視頻芯片,並在2019年宣布了一款用於視頻轉碼和推理工作的ASIC。MSVP就是這些努力的成果之一,也是在流播領域重新推動競爭的結果。
Meta技術主管哈里克里希納·雷迪和陳雲青(音)在他們合著的博客文章中寫道:“僅在Facebook上,人們就把50%的時間花在了觀看視頻上。我們需要服務於世界各地的各種設備(如移動設備、筆記本電腦、電視等),例如上傳到Facebook或Instagram的視頻被轉碼成多個比特流,它們具有不同的編碼格式、分辨率和質量,MSVP是可編程和可擴展的,可以配置為有效地支持VOD所需的高質量轉碼,以及直播所需的低延遲和更快的處理時間。”
圖3:Meta的定製芯片旨在加速視頻工作負載,如流播和轉碼
Meta表示,該公司的計劃是最終將大部分“穩定而成熟”的視頻處理工作負載轉移給MSVP,只對需要特定定製和“顯著”提高質量的工作負載使用軟件視頻編碼。Meta還稱,通過智能去噪和圖像增強等預處理方法,以及偽影去除和超分辨率等後期處理方法,MSVP在提高視頻質量方面的工作仍在繼續。
雷迪和陳雲青稱:“將來,MSVP將使我們能夠支持更多Meta最重要的用例和需求,包括短視頻,從而實現生成式人工智能、AR/VR和其他虛擬現實內容的高效交付。”
如果說最新硬件公告中有一個共同點的主線,那就是Meta正在拚命加快人工智能的發展步伐,特別是在生成式人工智能方面。
今年2月,據稱Meta首席執行官馬克·扎克伯格已將提升Meta的人工智能計算能力作為首要任務,他宣布成立新的頂級生成式人工智能團隊,用他的話說,這將為公司的研發“渦輪增壓”。Meta首席技術官安德魯·博斯沃思最近也表示,生成式人工智能是他和扎克伯格花費最多時間的領域。據Meta首席科學家楊立昆透露,該公司計劃部署生成式人工智能工具,在虛擬現實中創造物品。
今年4月,扎克伯格在Meta第一季度財報電話會議上表示:“我們正在探索WhatsApp和Messenger的聊天體驗,Facebook和Instagram上的帖子和廣告的視覺創作工具,以及隨着時間推移的視頻和多模式體驗。我希望這些工具對每個人都有價值,從普通人到創作者再到企業都是如此。例如,我預計,一旦我們獲得了這種體驗,就會有很多人對商業信息傳遞和客戶支持方面的人工智能代理產生興趣。隨着時間的推移,這也將擴展到我們在虛擬世界的工作中,在那裡人們將更容易創建化身、對象、世界和將所有這些聯繫在一起的代碼。”
在某種程度上,Meta正感到到越來越大的壓力,投資者擔心該公司的行動不夠快,無法在生成式人工智能的巨大潛在市場分一杯羹。目前,該公司還沒有推出可與Bard、必應或ChatGPT等聊天機器人競爭的產品。在圖像生成方面也沒有取得太大進展,這是另一個爆炸式增長的關鍵領域。
如果這些預測是正確的,生成式人工智能軟件的總目標市場規模可能達到1500億美元。美國投行高盛預測,這將使GDP增長7%。
即使部分預測成真,也可以彌補Meta在增強現實頭盔、會議軟件和Horizon Worlds等元宇宙技術上的數十億美元投資損失。Meta負責增強現實技術的部門Reality Labs上個季度凈虧損40億美元,預計整個2023年的運營虧損將繼續增加。