所有語言
分享
划重點
在美國得克薩斯州奧斯汀一棟絲毫不起眼的辦公樓里,幾個亞馬遜員工正在兩個小房間里設計兩種微芯片,用於訓練和加速生成式人工智能。這兩款定製芯片的代號分別為Inentia和Trainium,它們為亞馬遜雲服務AWS客戶提供了一種替代選擇,可以代替英偉達圖形處理器培訓大語言模型。目前,採購英偉達的圖形處理器越來越難,而價格也越來越高。
AWS首席執行官亞當·塞利普斯基(Adam Selipsky)在6月份接受採訪時表示:“全世界都希望有更多的芯片用於支持生成式人工智能,無論是圖形處理器還是亞馬遜自己設計的芯片。我認為,與世界上任何其他公司相比,我們更有可能為客戶提供這種人人都想要的能力。”
然而,其他公司採取了更快的行動,投入了更多的資金,並從人工智能熱潮中借到了東風。當OpenAI於去年11月推出ChatGPT時,微軟因託管這款爆火的人工智能聊天機器人而受到廣泛關注。據報道,微軟向OpenAI投資了130億美元。今年2月,微軟迅速將生成式人工智能模型添加到自己的產品中,並將其整合到必應中。
同月,谷歌推出了自己的大語言模型Bard,隨後又向OpenAI的競爭對手Anthropic投資了3億美元。
而直到今年4月,亞馬遜才宣布了自己的大語言模型Titan,同時推出了名為Bedrock的服務,以幫助開發人員使用生成式人工智能來增強軟件能力。
市場研究機構Gartner副總裁、分析師奇拉格·德凱特(Chirag Dekate)表示:“亞馬遜不習慣於追逐市場,而是習慣於創造市場。我認為,很長一段時間以來,他們第一次發現自己處於劣勢,現在正在努力追趕。”
Meta最近也發布了自己的大語言模型Llama 2,這個奉行開源模式的ChatGPT競爭對手現在可以在微軟Azure公共雲上進行測試。
德凱特說,從長遠來看,亞馬遜的定製芯片可能會讓它在生成式人工智能方面佔據優勢。他解釋稱:“我認為,真正的區別在於他們所擁有的技術能力,因為微軟沒有Trainium或Interentia。”
圖:AWS在2013年就開始生產定製芯片Nitro,它是目前容量最大的AWS芯片
早在2013年,AWS就通過一款名為Nitro的專用硬件悄然開始生產定製芯片。亞馬遜透露,Nitro是目前容量最大的AWS芯片,每台AWS服務器上至少有一個,使用總數超過2000萬。
2015年,亞馬遜收購了以色列芯片初創公司Annapurna Labs。然後在2018年,亞馬遜推出了基於英國芯片設計公司Arm架構的服務器芯片Graviton,這是AMD和英偉達等巨頭x86 CPU的競爭對手。
伯恩斯坦研究公司(Bernstein Research)高級分析師斯泰西·拉斯貢(Stacy Rasgon)表示:“Arm芯片在服務器總銷售額中所佔的比例可能高達10%,其中很大一部分將來自亞馬遜。所以在CPU方面,他們做得相當不錯。”
同樣在2018年,亞馬遜推出了專註於人工智能的芯片。兩年前,谷歌發布了首款張量處理器(Tensor Processor Unit,簡稱TPU)。微軟尚未宣布其正在與AMD合作開發的人工智能芯片Athena。
亞馬遜在美國得克薩斯州奧斯汀設有芯片實驗室,並在那裡開發和測試Trainium和Inferentia。該公司產品副總裁馬特·伍德(Matt Wood)解釋了這兩種芯片的用途。
他說:“機器學習分為這兩個不同的階段。所以,你需要訓練機器學習模型,然後對這些訓練過的模型進行推理。與在AWS上訓練機器學習模型的其他方式相比,Tradium在性價比方面提高了約50%。”
繼2019年推出第二代Interentia之後,Trainium於2021年首次上市。伍德說,Interentia允許客戶“提供低成本、高吞吐量、低延遲的機器學習推理,這是你在生成式人工智能模型中輸入提示時獲得的所有預測,所有這些都會得到處理,然後獲得響應。”
然而,就目前而言,在訓練模型方面,英偉達的圖形處理器仍然是無可爭議的王者。今年7月,AWS推出了基於英偉達H100的新AI加速硬件。
拉斯貢說:“在過去15年裡,英偉達圍繞其芯片建立起了龐大的軟件生態系統,這是其他公司所沒有的。目前,人工智能領域的最大贏家就是英偉達。”
圖:亞馬遜的定製芯片,從左到右分別為Inferentia、Trainium和Graviton
然而,AWS在雲計算領域的主導地位是亞馬遜的一大優勢。
市場研究機構Gartner副總裁分析師奇拉格·德凱特說:“亞馬遜不需要額外關注,該公司已經擁有非常強大的雲安裝基礎。他們所需要做的就是弄清楚如何利用生成式人工智能使現有客戶擴展到價值創造運動中。”
當在亞馬遜、谷歌和微軟之間選擇生成式人工智能時,數百萬AWS客戶可能會被亞馬遜吸引,因為他們已經熟悉亞馬遜,並在那裡運行其他應用並存儲數據。
AWS技術副總裁麥蘭·湯姆森·布科維奇(Mai-Lan Tomsen Bukovec)解釋說:“這是一個有關速度的問題。這些公司能夠以多快的速度開發這些生成式人工智能應用程序,取決於他們首先從AWS中的數據開始,並使用我們提供的計算和機器學習工具來推動的。”
Gartner提供的數據显示,AWS是全球最大的雲計算提供商,2022年佔據了40%的市場份額。儘管亞馬遜的營業利潤已經連續三個季度同比下降,但在亞馬遜第二季度77億美元的營業利潤中,AWS仍然佔到了70%。從歷史上看,AWS的運營利潤率遠高於谷歌雲。
此外,AWS還擁有越來越多專註於生成式人工智能的開發者工具組合。AWS負責數據庫、分析和機器學習的副總裁斯瓦米·西瓦蘇布拉馬尼亞(Swami Sivasubramanian)表示:“讓我們把時鐘倒回去,甚至回到ChatGPT之前。這不像發生在那之後,我們突然匆忙拿出了一個計劃,因為你不可能在那麼快的時間內設計出一款新芯片,更不可能在2到3個月的時間內建立一項基礎服務。”
Bedrock可以讓AWS客戶訪問由Anthropic、Stability AI、AI21 Labs和亞馬遜Titan開發的大語言模型。西瓦蘇布拉馬尼亞說:“我們不相信一種模型會統治世界,我們希望我們的客戶擁有來自多個供應商的最先進模型,因為他們會為正確的工作選擇正確的工具。”
圖:在得克薩斯州奧斯汀的AWS芯片實驗室,亞馬遜員工正在研發定製人工智能芯片
亞馬遜最新的人工智能產品之一是AWS HealthScribe,該服務於7月推出,旨在幫助醫生使用生成式人工智能起草患者就診摘要。亞馬遜還有機器學習中心SageMaker,提供算法、模型等服務。
另一個重要工具是CodeWhisperer,亞馬遜表示,它使開發人員完成任務的速度平均提高了57%。去年,微軟也報告說,其編碼工具GitHub Copilot提高了工作效率。
今年6月,AWS宣布了斥資1億美元建立生成式人工智能創新中心。AWS首席執行官塞利普斯基表示:“我們有很多客戶都想要生成式人工智能技術,但他們不一定知道這在他們自己的業務背景下對他們意味着什麼。因此,我們將引入解決方案架構師、工程師、策略師和數據科學家,與他們一對一地合作。”
雖然到目前為止,AWS主要專註於開發工具,而不是打造ChatGPT的競爭對手,但最近被泄露的一份內部郵件显示,亞馬遜首席執行官安迪·賈西(Andy Jassy)正在直接監督一個新的中央團隊,該團隊也在構建可擴展的大語言模型。
在第二季度財報電話會議上,賈西曾表示,AWS“相當大的一部分”業務現在是由人工智能及其支持的20多種機器學習服務所驅動,其客戶包括飛利浦、3M、Old Mutual和滙豐銀行。
人工智能的爆炸式增長帶來了一系列安全擔憂,公司擔心員工將專有信息放入公共大語言模型使用的培訓數據中。
AWS首席執行官塞利普斯基說:“我無法告訴你,我接觸過的財富500強公司有多少家禁用了ChatGPT。因此,通過我們的生成式人工智能方法和Bedrock服務,你通過Bedrock所做的任何事情、使用的任何模型,都將在你自己獨立的虛擬私有雲環境中。它將被加密,它將具有相同的AWS訪問控制。”
目前,亞馬遜只是在加速推進生成式人工智能,聲稱目前有“超過10萬”客戶在AWS上使用機器學習。雖然這隻佔AWS數百萬客戶的一小部分,但分析師表示,這種情況可能會改變。
市場研究機構Gartner副總裁分析師奇拉格·德凱特稱:“我們沒有看到企業在說:哦,等一下,微軟已經在生成式人工智能方面領先,讓我們走出去,讓我們改變我們的基礎設施戰略,把所有東西都遷移到微軟。如果你已經是亞馬遜的客戶,你很可能會更廣泛地探索亞馬遜的生態系統。”(文/金鹿)