所有語言
分享
文章來源:頭部科技
文丨Congerry
OpenAI 放出了一個迷霧彈。
當Google、Meta、Anthropic等公司都在猛推大模型的時候,OpenAI除了對GPT-4修修補補,似乎一直沒有什麼大的動靜。
但是今天,一個名為"gpt2-chatbot"的神秘大模型憑空殺出,其能力似乎與 GPT-4 保持在同一水準,甚至在一些任務上的表現比 GPT-4 Turbo 還要好,讓整個AI社區炸開了鍋。
這不禁讓人聯想一直未曾露面的GPT-4.5或GPT-5。就連Sam Altman也發了一段讓人摸不着頭腦的話,自己對 gpt2 情有獨鍾。
這個"gpt2-chatbot"表現如何呢?
該模型第一次嘗試就解決了國際數學奧林匹克競賽(一項面向高中生的著名競賽)中的一個問題。
人工智能研究員、斯坦福大學學生Andrew Gao說,要知道國際數學奧林匹克競賽難得要命,只有美國數學成績最好的四名學生才能參加比賽。
賓夕法尼亞大學沃頓商學院研究 AI 的教授 Ethan Mollick 表示,在他的實驗中,該模型在複雜的推理任務(例如編寫代碼繪製獨角獸圖片)上表現優於 GPT-4。“也許比 GPT-4 更好,”他說。“很難說,但它在標誌性的‘用代碼畫獨角獸’任務上確實做得更好。”
該模型還表現出了編寫具有挑戰性的代碼的能力。
CodeGen 的創始工程師 Chase McCoy 表示,gpt2-chatbot “在我們用來測試新模型的所有編碼提示上都做得更好”,而不是 GPT-4 或 Claude Opus。“這種氛圍肯定是存在的,”他說。
但也有不少人持謹慎懷疑態度,認為gpt2-chatbot的能力被過度誇大了。他們指出:
這個模型在經典的24點遊戲、數學推導等老題types仍然採取的是暴力式枚舉推理,而未展現出任何更先進的解題手段。
在繪畫時,也不遵從指令。
在經典的"農夫過河"推理題上,gpt2-chatbot的5步解法也顯得冗長。
那麼,這個gpt2-chatbot到底是什麼來頭?
通過對它的一些細節分析,網友們給出了以下幾種可能:
它就是OpenAI後繼GPT-4的下一代大模型GPT-4.5,或者是傳聞已久的GPT-5。
但是Andrew Gao認為,如果這就是GPT-4.5或者GPT-5的能力,那麼意味着人類在AI上面碰壁了。言外之意,gpt2-chatbot“不配”。
也有網友認為它是在GPT-4的基礎上,融合了開創性的"Q*"推理技術,而非全新架構。這可以解釋它為什麼在某些特定任務上能給出遠超GPT-4的驚人表現。
還有網友認為它是由OpenAI 2019年發布的GPT-2模型經過了LMSYS等機構的特殊調教和改造所獲得,其實質還是老架構。
另外,還有人猜想它其實就是由LMSYS這家從事AI技術研究的公司打造出來的全新模型,只是在整個AI界偽裝成"來自OpenAI"罷了。
對於這個謎一樣的問題,Sam Altman也是賣了個關子,在推特上表示"我確實很鍾情gpt2。
除了gpt2-chatbot,OpenAI本身也在悄悄推出一些重磅新功能。
最新的消息是,OpenAI正在為ChatGPT Plus用戶推出一項全新的"記憶"功能。簡單來說,用戶在與ChatGPT對話時,可以讓它記住特定的信息細節,這些記憶會一直保留下去,並會在下一次對話時被調用和使用。
比如,如果你告訴ChatGPT你家裡的小孩特別喜歡水母,那麼下次讓它幫忙設計生日賀卡時,它就會為你推薦使用水母圖案。OpenAI稱,未來ChatGPT甚至可能比你的家人更了解你了。
這個"人性化"的記憶功能,被認為是朝着AGI(人工通用智能)邁出的一小步。它讓ChatGPT更貼近真實世界,個性化程度更高,對話體驗也更加自然。多數網友對此新功能表示歡迎,不過也有人擔心隱私問題。
OpenAI還透露,未來這個功能還會面向企業用戶推出,並擴展到GPT語言模型的其他版本。