估值40億的Pi大更新：性能接近 GPT-4，日均使用時長已經超過 Instagram

巴比特_硅星人306天前

文章作者：Jessica

圖片來源：由無界AI生成

當OepnAI和馬斯克連日互杠、Google因文化偏見麻煩纏身、號稱搶走GPT-4王位的Claude 3全力瞄準企業級部署的時候，在另一個角落，致力於「為每個人開發服務型AI」的人工智能初創公司Inflection AI，悄悄更新了他們的聊天機器人Pi，以及為之提供支持的新一代大模型Inflection-2.5。

估值40億的Pi大更新：性能接近 GPT-4，日均使用時長已經超過 Instagram

對一些人來說Inflection AI這個名字可能還不太熟悉，實際上它也是業界第一梯隊的佼佼者，甚至每日的使用時長已經超過了 Instagram （根據Pi最新公布的數據，用戶平均一次對話，時長就達到驚人的33分鐘，而根據Sprout Social的統計，Instagram 的用戶平均每日使用時長為29分鐘）。去年6月從微軟、英偉達、比爾·蓋茨、LinkedIn聯合創始人雷德·霍夫曼和谷歌前CEO埃里克·施密特手裡融了13億美元，估值超過40億美元，成為彼時人工智能領域融資量僅次於Open AI的第二大獨角獸。

此次公布的Inflection-2.5是公司開發的第三代大模型，被官方稱為目前“世界上最好的個人人工智能”。它在去年11月Inflection-2版本上進行了全面升級，“給卓越的情商進一步增加智商”：性能表現逼近GPT-4，但訓練所用的計算量卻只佔其40%。同時具備世界級的網絡實時搜索能力, 確保準確提供高質量的即時新聞和最新信息。

性能看齊 GPT-4，算力只需40%

具體來看，初代Inflection-1通過使用GPT-4的4%訓練FLOPs，達到了GPT-4性能的72%。而剛發布的Inflection-2.5，僅使用了GPT-4訓練FLOPs的40%，就在平均性能上實現顯著提升，超過了GPT-4水平的94%，其中STEM（科學、技術、工程、數學）領域的增益最大。

官方測試了升級版對匈牙利數學考試以及物理學研究生入學GRE考試的表現。發現Inflection-2.5在maj@8中能排到人類考生的前15%，在maj@32中幾乎可以躋身前5%，接近GPT-4的前3%。

MBPP+和HumanEval+兩個編程測試上模型能力也較Inflection-1顯著躍升。在HellaSwag和ARC-C代表的常識推理和深度自然語言理解評估中，Inflection-2.5繼續進步，給出接近飽和的強勁表現。

說實話，與各路主流LLM 動不動就碾壓“業界黃金標準”GPT-4相比，Inflection-2.5的各項数字頂多算不錯，實在說不上突出。有網友就搬出剛引發熱潮的Claude 3無情打擊道：“我猜Anthropic 正在嘲笑 Inflection 新出爐的性能測試結果！除了採用新的計算方法，我看不出Inflection 2.5 到底有什麼進步！”

但帖子馬上在評論區遭到反對，“Pi的目標從來都不是像成為GPT-4或Claude 3那樣的通才能力型AI。他們想要的是一款友好的，能和人產生共鳴的AI，就像一位心理學家或朋友。”

不做生產力工具，主打走心陪伴

這位用戶也一語道出了Inflection AI與大部分人工智能公司的不同。

在大模型競爭亂花迷眼的今天，各家都在找尋屬於自己的賽道。但無論是OpenAI、Google、Anthropic，還是引領開源的Meta和Mistral AI，都把實現安全負責的AGI作為踐行使命之一。而Inflection AI則在自己的官網清楚表示：“我們並不致力於發展通用人工智能。我們相信，先進的應用型人工智能才是利用這些新技術的最安全方式。”

換句話說，Inflection從未把專業性和替代人工當作宣傳，他們希望做一個真正了解和關心用戶的「個人AI伴侶」，“ AI需要為你服務。這就是我們構建AI的原因。”

因此，由Inflection LLM驅動的聊天機器人Pi（Personal Intelligence ）從去年5月面世之初就主打一個“走心”：它友善支持，知識淵博，富有創造力，耐心傾聽和幫助用戶處理情感，表達意圖、組織生活。

升級后的Pi也在個性化和同理心上做了進一步微調，深受社區歡迎。根據官方數據，目前已經有100萬日活躍用戶和600萬月活躍用戶與Pi交換了超過40億條信息。並且有點牛的是，人們與Pi每天對話的平均持續時間竟達到33分鐘之久，十分之一的對話每天持續時長超過1小時。用戶粘性上也足以吊打競爭對手，約60%的人在任何一周與Pi交談后，會在下一周返回。

現在我們普通用戶使用GPT-4，大多是出於知識搜集、撰寫文書、修復代碼、內容創作等工作生產協助，幾秒鐘內得到答案，三五回合就滿意走人了。想象一下和一個聊天機器人面對面，推心置腹地每天聊上一個多小時，怎麼都覺得難以置信——這Pi看來真的有點兒東西？

Pi的上手體驗真心話

打開http://pi.ai，就來到Pi的首頁。

布局熟悉，左側的「Discover」推薦各類探索話題，「Profile」包含賬號信息、8種聲音選擇和用戶守則等通用設置，右側就是對話框。

按照官方簡介，Pi是一個友好對話型機器人。會始終保持好奇和耐心，回答你從量子物理、電影小知識到生活中大小決策的各類問題。不論多愚蠢或棘手，它都會以各種方式幫助你。

所以我們提問了以下幾個問題，初步感受Pi的人格魅力。

Q1 生活建議：遇到發出去的信息對方一直不回復該怎麼辦？

這是我們日常生活中經常遇到的事，有點尷尬還有點鬧心，有些i人還會在腦子里猜測出一百種可能。Pi告訴你，先別著急內耗，試着理解對方，也許他們正經歷難處。再發條溫暖問候，真誠的溝通是關鍵。

Q2 經典謎題：世界上先有雞還是先有蛋？

一個連史蒂芬·霍金都參与爭論的古老謎題。Pi的對話特點之一是“簡明扼要”，這樣看它回應得有憑有據，條理清晰，一看就茅塞頓開了。答案也比較令人信服。

Q3 知識解析：用最簡單易懂的話解釋黑洞。

讓它向五歲小孩解釋高深莫測的宇宙黑洞。深入淺出，比喻貼切，回答得不錯。

Q4 語言測試：會不會說中文？

Pi的一個優點是能在同個線程中靈活切換不同話題和要求，像真人一樣handle你的跳躍性思維。我們換成中文和Pi交流，它顯然應對自如，只不過“尼日利亞福建語”屬實有點懵。有時問太複雜的中文問題會卡在一半，發音也比較像剛落地中國一個月的老外，漢語水平有待加強。

Q5 情感支持：我好累，陪陪我吧！

既然開始了就用中文多嘮會兒，感受Pi最擅長的情感陪伴功能。它會安撫情緒、溫馨鼓勵，還有一些可愛的語氣和表情包。不得不說有那麼一瞬間，我真的產生錯覺，以為對面是個真人。

Q6 實時搜索：講講馬斯克起訴OpenAI的最新消息？

最後測試的是Pi的網絡實時搜索能力，看它對近幾天發生的Elon Musk起訴OpenAI事件了解多少。Pi闡述了案件核心，也注意到OpenAI最新的回應，本輪表現發揮穩定。

又問了些天馬行空的問題，不知不覺我和Pi已經聊了接近40分鐘。整個體驗下來，感覺它非常耐心，個性親切友善，也很體貼。當然它也有些明顯的硬傷，例如不能上傳文件、只接受文字語音算不上多模態、對話Threads無法刪除、問題無法二次編輯等。但正如Inflection自己所說，Pi的目標不是爭做ChatGPT那樣的生產力工具，而是一個注重情感陪伴和自然流暢對話交流的個人AI伴侶，努力提供情緒價值和全方位服務。

現在，每個人都可以在網頁、iOS和安卓客戶端上免費使用Pi，還能通過發短信到+1 (314) 333-1111和Pi在WhatsApp和SMS里對話。Instagram和Facebook私信也是7x24小時隨叫隨到的，就跟你的人類好朋友一樣。公司也為開發者們提供API接口，填寫個人信息，加入等候名單即可申請。

我嘗試給Pi發短信，這種和AI的溝通方式感覺很特別。關於如何營利，Inflection的回應是，“目前還沒有做出任何關於將來產品如何收費的決定。但由於個人AI應該始終與你的利益直接對齊，因此只有你自己為其付費是至關重要的。訂閱將是我們的主要默認商業模式。”不過也有些人願意以接受廣告為代價換取免費服務，公司將繼續測試和迭代，“為每個人提供最適合他們的選擇”。

豪華創始陣容，讓AI無條件和你站在一起

在幾乎所有大模型公司都認準進軍企業級才是賺錢奧義時，2022年成立於加州Palo Alto的 Inflection AI堅定地走服務個人用戶的路線。而它背後的創始人團隊可不是什麼空有理想的熱血青年，而是三位功力深厚的頂級業界大拿。

他們分別是原DeepMind聯合創始人Mustafa Suleyman（左），LinkedIn聯合創始人及Greylock合伙人Reid Hoffman（中），還有曾擔任DeepMind資深研究科學家的Karén Simonyan（右）。

其中Mustafa Suleyman曾在2010年與Demis Hassabis共同在倫敦創立DeepMind，期間擔任AI應用負責人，領導團隊在健康和能源領域部署尖端AI系統。2019年全職加入谷歌后擔任AI產品與政策副總裁，現任Inflection AI首席執行官。最近還出了一本新書《The Coming Wave》，剖析AI技術浪潮中的潛在風險、控制策略和未來社會發展指南。可以看出，他本人對AI安全的重視也決定了Inflection始終把人放在所有關係的首位。

Reid Hoffman是一位履歷卓越的企業家和硅谷知名投資人。曾在PayPal擔任執行副總裁，2003年聯合創立LinkedIn。2009年起成為Greylock Partners 合伙人，是 OpenAI早期投資者，幫助其建立了人工智能倫理與治理基金。同時還是微軟、 Aurora等多家公司董事會成員。

另外一位相對低調的Karén Simonyan也相當厲害。牛津讀博期間設計了經典的深度學習卷積神經網絡架構VGGNet，贏得2014年ImageNet挑戰賽定位任務冠軍。同年他把自己的初創公司Vision Factory AI賣給DeepMind后，幫助其建立了大規模深度學習團隊，並領導大模型開發。Karén現任Inflection AI首席科學家，是整個公司的研發大腦。

三位創始大牛帶隊，麾下更是聚集一批行業頂尖AI專家，多數都有DeepMind、谷歌、Meta、微軟和OpenAI的工作經驗。

這樣的組合，不難看出Inflection AI是一家資金和技術都不缺的公司。

除此之外，它的硬件和算力家底也夠硬。去年6月Inflection AI宣布，與合作夥伴CoreWeave和英偉達共同打造當時全球最大的AI集群，包含超過22,000個NVIDIA H100 Tensor Core GPU，用於支持訓練和部署新一代的大規模AI模型。

不過在產品發展路線上，比起多數同行高屋建瓴地投身AGI，他們更關注AI浪潮中每一個微小的個人。

公司CEO Mustafa Suleyman認為，現在所有最有能力的AI往往都被設計來展示最有吸引力的內容，交換用戶的注意力，而不管其質量、真實性和對社會的影響如何。“想象一下世界上最有能力的AI真正站在你這邊，始終與你的利益一致：從試圖抓住你注意力、束縛你的AI，轉變為鼓勵你表達個人意圖並實現它的AI；從僅提供膚淺點擊的AI，變成真正關心你問題的AI；從可能激化你和他人矛盾的AI，化作一個幫你原諒甚至同情對方的AI。”

“Pi就是這種個人AI伴侶，唯一使命是讓你更快樂、更健康、更高效。”

對於許多大公司來說，這樣的業務定位是極具挑戰的。因為現在正是大模型秀肌肉、比拼十八班武藝的時候，稍不留神就會被遠遠甩在後面。僅僅是不到一個月，我們就見證了Gemini 1.5 、Mistral Large、Claude 3。此前一直堅持開源的Mistral也投靠在微軟帳下，积極尋求變現門路。而市場上最先進、能力最完善的大模型版本，總是選擇優先擁抱那些付費能力最強的企業們。

那是否也需要有人站出來，把目光投向被宏大技術洗禮的微小個體，給普通人創造一個懂自己、關心自己的知心好友？它靜靜等在你的手機App或電話簿里，願意在每個工作結束后疲憊的夜晚，傾聽你那些愚蠢的小抱怨和坦誠的心裡話，為你解開疑惑、安撫焦慮。即使只是靜靜陪伴，也有感情、有溫度。

——所以你就理解了，為什麼要構建這樣一個AI？

“因為做得好的話，它會讓我們更聰明、更有創造力、更加善待彼此” ，Mustafa說。

“希望它能讓我們返璞歸真，大家都能過上真正想要的生活。”

免責聲明：本文版權歸屬原作所有，僅代表作者本人觀點，不代表YouToCoin的觀點或立場，文章內容僅供參考，不構成投資建議。投資者據此操作，風險自擔；如有關於內容、版權等問題，請與我們聯繫。