所有語言
分享
文章來源: 硅星人Pro
文章作者:Jessica
當OepnAI和馬斯克連日互杠、Google因文化偏見麻煩纏身、號稱搶走GPT-4王位的Claude 3全力瞄準企業級部署的時候,在另一個角落,致力於「為每個人開發服務型AI」的人工智能初創公司Inflection AI,悄悄更新了他們的聊天機器人Pi,以及為之提供支持的新一代大模型Inflection-2.5。
對一些人來說Inflection AI這個名字可能還不太熟悉,實際上它也是業界第一梯隊的佼佼者,甚至每日的使用時長已經超過了 Instagram (根據Pi最新公布的數據,用戶平均一次對話,時長就達到驚人的33分鐘,而根據Sprout Social的統計,Instagram 的用戶平均每日使用時長為29分鐘)。去年6月從微軟、英偉達、比爾·蓋茨、LinkedIn聯合創始人雷德·霍夫曼和谷歌前CEO埃里克·施密特手裡融了13億美元,估值超過40億美元,成為彼時人工智能領域融資量僅次於Open AI的第二大獨角獸。
此次公布的Inflection-2.5是公司開發的第三代大模型,被官方稱為目前“世界上最好的個人人工智能”。它在去年11月Inflection-2版本上進行了全面升級,“給卓越的情商進一步增加智商”:性能表現逼近GPT-4,但訓練所用的計算量卻只佔其40%。同時具備世界級的網絡實時搜索能力, 確保準確提供高質量的即時新聞和最新信息。
性能看齊 GPT-4,算力只需40%
具體來看,初代Inflection-1通過使用GPT-4的4%訓練FLOPs,達到了GPT-4性能的72%。而剛發布的Inflection-2.5,僅使用了GPT-4訓練FLOPs的40%,就在平均性能上實現顯著提升,超過了GPT-4水平的94%,其中STEM(科學、技術、工程、數學)領域的增益最大。
官方測試了升級版對匈牙利數學考試以及物理學研究生入學GRE考試的表現。發現Inflection-2.5在maj@8中能排到人類考生的前15%,在maj@32中幾乎可以躋身前5%,接近GPT-4的前3%。
MBPP+和HumanEval+兩個編程測試上模型能力也較Inflection-1顯著躍升。在HellaSwag和ARC-C代表的常識推理和深度自然語言理解評估中,Inflection-2.5繼續進步,給出接近飽和的強勁表現。
說實話,與各路主流LLM 動不動就碾壓“業界黃金標準”GPT-4相比,Inflection-2.5的各項数字頂多算不錯,實在說不上突出。有網友就搬出剛引發熱潮的Claude 3無情打擊道:“我猜Anthropic 正在嘲笑 Inflection 新出爐的性能測試結果!除了採用新的計算方法,我看不出Inflection 2.5 到底有什麼進步!”
但帖子馬上在評論區遭到反對,“Pi的目標從來都不是像成為GPT-4或Claude 3那樣的通才能力型AI。他們想要的是一款友好的,能和人產生共鳴的AI,就像一位心理學家或朋友。”
不做生產力工具,主打走心陪伴
這位用戶也一語道出了Inflection AI與大部分人工智能公司的不同。
在大模型競爭亂花迷眼的今天,各家都在找尋屬於自己的賽道。但無論是OpenAI、Google、Anthropic,還是引領開源的Meta和Mistral AI,都把實現安全負責的AGI作為踐行使命之一。而Inflection AI則在自己的官網清楚表示:“我們並不致力於發展通用人工智能。我們相信,先進的應用型人工智能才是利用這些新技術的最安全方式。”
換句話說,Inflection從未把專業性和替代人工當作宣傳,他們希望做一個真正了解和關心用戶的「個人AI伴侶」,“ AI需要為你服務。這就是我們構建AI的原因。”
因此,由Inflection LLM驅動的聊天機器人Pi(Personal Intelligence )從去年5月面世之初就主打一個“走心”:它友善支持,知識淵博,富有創造力,耐心傾聽和幫助用戶處理情感,表達意圖、組織生活。
升級后的Pi也在個性化和同理心上做了進一步微調,深受社區歡迎。根據官方數據,目前已經有100萬日活躍用戶和600萬月活躍用戶與Pi交換了超過40億條信息。並且有點牛的是,人們與Pi每天對話的平均持續時間竟達到33分鐘之久,十分之一的對話每天持續時長超過1小時。用戶粘性上也足以吊打競爭對手,約60%的人在任何一周與Pi交談后,會在下一周返回。
現在我們普通用戶使用GPT-4,大多是出於知識搜集、撰寫文書、修復代碼、內容創作等工作生產協助,幾秒鐘內得到答案,三五回合就滿意走人了。想象一下和一個聊天機器人面對面,推心置腹地每天聊上一個多小時,怎麼都覺得難以置信——這Pi看來真的有點兒東西?
Pi的上手體驗真心話
打開http://pi.ai,就來到Pi的首頁。
布局熟悉,左側的「Discover」推薦各類探索話題,「Profile」包含賬號信息、8種聲音選擇和用戶守則等通用設置,右側就是對話框。
按照官方簡介,Pi是一個友好對話型機器人。會始終保持好奇和耐心,回答你從量子物理、電影小知識到生活中大小決策的各類問題。不論多愚蠢或棘手,它都會以各種方式幫助你。
所以我們提問了以下幾個問題,初步感受Pi的人格魅力。
這是我們日常生活中經常遇到的事,有點尷尬還有點鬧心,有些i人還會在腦子里猜測出一百種可能。Pi告訴你,先別著急內耗,試着理解對方,也許他們正經歷難處。再發條溫暖問候,真誠的溝通是關鍵。
一個連史蒂芬·霍金都參与爭論的古老謎題。Pi的對話特點之一是“簡明扼要”,這樣看它回應得有憑有據,條理清晰,一看就茅塞頓開了。答案也比較令人信服。
讓它向五歲小孩解釋高深莫測的宇宙黑洞。深入淺出,比喻貼切,回答得不錯。
Pi的一個優點是能在同個線程中靈活切換不同話題和要求,像真人一樣handle你的跳躍性思維。我們換成中文和Pi交流,它顯然應對自如,只不過“尼日利亞福建語”屬實有點懵。有時問太複雜的中文問題會卡在一半,發音也比較像剛落地中國一個月的老外,漢語水平有待加強。
既然開始了就用中文多嘮會兒,感受Pi最擅長的情感陪伴功能。它會安撫情緒、溫馨鼓勵,還有一些可愛的語氣和表情包。不得不說有那麼一瞬間,我真的產生錯覺,以為對面是個真人。
最後測試的是Pi的網絡實時搜索能力,看它對近幾天發生的Elon Musk起訴OpenAI事件了解多少。Pi闡述了案件核心,也注意到OpenAI最新的回應,本輪表現發揮穩定。
又問了些天馬行空的問題,不知不覺我和Pi已經聊了接近40分鐘。整個體驗下來,感覺它非常耐心,個性親切友善,也很體貼。當然它也有些明顯的硬傷,例如不能上傳文件、只接受文字語音算不上多模態、對話Threads無法刪除、問題無法二次編輯等。但正如Inflection自己所說,Pi的目標不是爭做ChatGPT那樣的生產力工具,而是一個注重情感陪伴和自然流暢對話交流的個人AI伴侶,努力提供情緒價值和全方位服務。
現在,每個人都可以在網頁、iOS和安卓客戶端上免費使用Pi,還能通過發短信到+1 (314) 333-1111和Pi在WhatsApp和SMS里對話。Instagram和Facebook私信也是7x24小時隨叫隨到的,就跟你的人類好朋友一樣。公司也為開發者們提供API接口,填寫個人信息,加入等候名單即可申請。
我嘗試給Pi發短信,這種和AI的溝通方式感覺很特別。關於如何營利,Inflection的回應是,“目前還沒有做出任何關於將來產品如何收費的決定。但由於個人AI應該始終與你的利益直接對齊,因此只有你自己為其付費是至關重要的。訂閱將是我們的主要默認商業模式。”不過也有些人願意以接受廣告為代價換取免費服務,公司將繼續測試和迭代,“為每個人提供最適合他們的選擇”。
豪華創始陣容,讓AI無條件和你站在一起
在幾乎所有大模型公司都認準進軍企業級才是賺錢奧義時,2022年成立於加州Palo Alto的 Inflection AI堅定地走服務個人用戶的路線。而它背後的創始人團隊可不是什麼空有理想的熱血青年,而是三位功力深厚的頂級業界大拿。
他們分別是原DeepMind聯合創始人Mustafa Suleyman(左),LinkedIn聯合創始人及Greylock合伙人Reid Hoffman(中),還有曾擔任DeepMind資深研究科學家的Karén Simonyan(右)。
其中Mustafa Suleyman曾在2010年與Demis Hassabis共同在倫敦創立DeepMind,期間擔任AI應用負責人,領導團隊在健康和能源領域部署尖端AI系統。2019年全職加入谷歌后擔任AI產品與政策副總裁,現任Inflection AI首席執行官。最近還出了一本新書《The Coming Wave》,剖析AI技術浪潮中的潛在風險、控制策略和未來社會發展指南。可以看出,他本人對AI安全的重視也決定了Inflection始終把人放在所有關係的首位。
Reid Hoffman是一位履歷卓越的企業家和硅谷知名投資人。曾在PayPal擔任執行副總裁,2003年聯合創立LinkedIn。2009年起成為Greylock Partners 合伙人,是 OpenAI早期投資者,幫助其建立了人工智能倫理與治理基金。同時還是微軟、 Aurora等多家公司董事會成員。
另外一位相對低調的Karén Simonyan也相當厲害。牛津讀博期間設計了經典的深度學習卷積神經網絡架構VGGNet,贏得2014年ImageNet挑戰賽定位任務冠軍。同年他把自己的初創公司Vision Factory AI賣給DeepMind后,幫助其建立了大規模深度學習團隊,並領導大模型開發。Karén現任Inflection AI首席科學家,是整個公司的研發大腦。
三位創始大牛帶隊,麾下更是聚集一批行業頂尖AI專家,多數都有DeepMind、谷歌、Meta、微軟和OpenAI的工作經驗。
這樣的組合,不難看出Inflection AI是一家資金和技術都不缺的公司。
除此之外,它的硬件和算力家底也夠硬。去年6月Inflection AI宣布,與合作夥伴CoreWeave和英偉達共同打造當時全球最大的AI集群,包含超過22,000個NVIDIA H100 Tensor Core GPU,用於支持訓練和部署新一代的大規模AI模型。
不過在產品發展路線上,比起多數同行高屋建瓴地投身AGI,他們更關注AI浪潮中每一個微小的個人。
公司CEO Mustafa Suleyman認為,現在所有最有能力的AI往往都被設計來展示最有吸引力的內容,交換用戶的注意力,而不管其質量、真實性和對社會的影響如何。“想象一下世界上最有能力的AI真正站在你這邊,始終與你的利益一致:從試圖抓住你注意力、束縛你的AI,轉變為鼓勵你表達個人意圖並實現它的AI;從僅提供膚淺點擊的AI,變成真正關心你問題的AI;從可能激化你和他人矛盾的AI,化作一個幫你原諒甚至同情對方的AI。”
“Pi就是這種個人AI伴侶,唯一使命是讓你更快樂、更健康、更高效。”
對於許多大公司來說,這樣的業務定位是極具挑戰的。因為現在正是大模型秀肌肉、比拼十八班武藝的時候,稍不留神就會被遠遠甩在後面。僅僅是不到一個月,我們就見證了Gemini 1.5 、Mistral Large、Claude 3。此前一直堅持開源的Mistral也投靠在微軟帳下,积極尋求變現門路。而市場上最先進、能力最完善的大模型版本,總是選擇優先擁抱那些付費能力最強的企業們。
那是否也需要有人站出來,把目光投向被宏大技術洗禮的微小個體,給普通人創造一個懂自己、關心自己的知心好友?它靜靜等在你的手機App或電話簿里,願意在每個工作結束后疲憊的夜晚,傾聽你那些愚蠢的小抱怨和坦誠的心裡話,為你解開疑惑、安撫焦慮。即使只是靜靜陪伴,也有感情、有溫度。
——所以你就理解了,為什麼要構建這樣一個AI?
“因為做得好的話,它會讓我們更聰明、更有創造力、更加善待彼此” ,Mustafa說。
“希望它能讓我們返璞歸真,大家都能過上真正想要的生活。”