所有語言
分享
文章來源:硅星人Pro
作者:油醋
月之暗面,拿到了中國大模型初創公司自ChatGPT出現至今的最大一筆單輪融資,10億美元。
據36氪獲悉,這輪新的融資動作在近日完成,投資方包括從天使輪就已進場的紅杉中國,以及首次露面的小紅書、美團和阿里巴巴。
從去年年初攥着5000萬美金入局,到去年10月拿到老股東紅衫中國領投的近3億美元的新一輪融資,再到這筆10億美元融資完成,月之暗面估值已接近25億美金。
進入2024年,中國大模型創業的獨角獸又多了一隻。
月之暗面身上有三個鮮明的標籤:長文本、ToC和小團隊。
月之暗面第一次亮相,沒有寫詩,沒有寫代碼,而是用一個支持20萬漢字的超長文本輸入的AI產品完整吃下了一本《三體》。這在當時已經是市面上可使用的大模型中文本輸入長度最長的一個。與月之暗面亮相同期,文本長度方面最引人關注的Claude-100k換算成漢字也只有8萬字左右。
拉長文本輸入長度的價值顯而易見,輸入語料越長,需求就有被描述得越準確的潛力,大模型的幻覺會得到抑制,並且只有當大模型能夠閱讀的體量足夠大,它才能從懸空的思想實驗真正轉入實際應用。
對上下文長度的Scaling Law的探索已經迅速成為一種趨勢。GPT-4從一開始的4k、8k拓展到了GPT-4-turbo的128k,Anthropic將Claude2迭代到了200k的長度,國內的百川智能、零一萬物也陸續開始逼近200k的文本長度。
圖源:WEEL
被OpenAI搶了風頭的Gemini 1.5 Pro近日一次性將文本輸入長度拉到10m,考慮到Gemini的最初定位,拓展文本的輸入長度上線是在為模型的多模態能力鋪路。巧合的是,有媒體透露月之暗面當前已經在秘密研發通用多模態模型,預計今年內將推出。或許不是巧合,月之暗面創始人楊植麟本人在創業前的職業生涯中,曾短暫停留Google Brain。另一位同期也在Google Brain的研究員曾告訴硅星人,從2022甚至更早,Google Brain內部就已經明確了文本長度對大模型能力的價值。
將重心放在ToC上,是月之暗面身上另一個鮮明的標籤。
楊植麟曾表示,ToC就是一個自然而言的選擇,他看到的是一個成為AI時代Super App的機會。
月之暗面在第一次亮相時拿出來的,完整吃下了一本《三體》的產品是Kimi Chat,一個完全ToC的產品。一位月之暗面的研發團隊成員曾向硅星人透露過一些技術研发上的細節。技術團隊對於模型在訓練上的方向選擇,很大程度上基於Kimi Chat在端到端層面的表現。也就是說這首先是一家做產品的公司,大模型能力是實現路徑。
也因此,這家不缺錢的初創公司目前並不需要為了ToB組建一個巨大的交付團隊。去年年末,硅星人從月之暗面內部得到的信息是團隊人數在70人左右,這其中有公司主動維持一個小團隊的因素在。
不妨將目前國內身價相近的幾家大模型初創公司的團隊規模放在一起做個對比:
MiniMax目前估值超過12億美元,在去年年初的團隊規模達到了100人,現在到了200人;
目前累計融資金額達3.5億美元,估值超過10億美元的百川智能,團隊人數在成立8個月後已經超過200人;
在2023年累計完成25億人民幣融資,目前估值逼近20億美元的智譜AI,現在人數超過500人;
零一萬物成立最晚,但藉著李開復在AI領域巨大的號召力,估值已迅速到達10億美元,團隊規模方面則未有太多透露。
加上月之暗面,這五家是目前中國大模型領域所有的獨角獸公司。
這筆10億美元融資的另一個值得玩味的地方是,阿里巴巴、美團和小紅書第一次站在背後。大模型創業熱潮在前,背後是幾家互聯網巨頭之間的激烈卡位,其中又以阿里巴巴和騰訊最為活躍。
這五家初創公司中,阿里巴巴目前已經投資了MiniMax之外的其餘四家;騰訊投資了包括智譜AI、百川智能以及MiniMax在內的三家;美團則參与了智譜AI和月之暗面兩筆融資。
毫無疑問,由三位在Google Scholar上引用次數過萬的聯創所建立,又吸納了大量參与過Google Gemini、Google Bard等重要大模型研發人才的月之暗面有着極高的人才密度,這讓它成為目前最有投資價值的大模型初創公司之一。在楊植麟剛開始大模型創業時,大量VC曾試圖能夠在項目早期聯繫上他,但他對投資方的選擇十分謹慎。現在楊植麟和身邊這群專心做ToC產品的極客第一次和互聯網公司強勢的對外投資產生交集,後者作為產業投資往往不只是追求純粹的財務回報,而另有自己在企業戰略上的出發點。這筆融資這對於月之暗面來說,是放開手腳的機會,也是考驗。