所有語言
分享
作者 | 騰訊科技 郝博陽
圖片來源:由無界 AI 生成
“深度學習三巨頭”這個稱謂在AI的熱潮之中對各位讀者而言肯定不陌生。但深度學習人才濟濟之中,是靠什麼評價標準單單拎出Hinton,Yann Lecun,Yoshua Bengio這三位稱為巨頭?沒有比賽,辯論,排名,這個名頭是靠着AI領域最著名的記者凱德·梅茨早在18年用筆定下的。
作為《連線》雜誌資深作家,《紐約時報》人工智能欄目主筆,《深度學習革命》作者凱德·梅茨在十幾年的從業經歷之中基本上採訪了所有AI領域的知名專家,Sam Altman 在發布ChatGPT前和他諮詢意見,Hinton離開谷歌后找他談心。通過接觸這些核心人物,他還深入微軟,谷歌,Meta這樣的AI巨頭之中挖掘出各種核心商業決策背後的核心時刻和戲劇場面,前段時間寫成的《深度學習革命》一書,也首次披露了十年前那場改變人工智能進程的秘密競拍。
書中細緻報道了發生在2012年,那場對整個人工智能行業都產生了深遠影響的競拍會。
2012年12月,在太浩湖滑雪山腳下的一家賭場酒店中,因腰椎間盤突出而無法坐下的Hinton和他的兩名學生入住了一周。他和他剛剛成立,還沒有任何產品的公司接受着這個世界上最有名的公司們一輪輪的競拍,這些公司中,有微軟,谷歌,Deepmind 和百度。
最戲劇性的畫面出現在Hinton應付百度派出的時任研究院副院長余凱的突然來訪時,為了“不讓他認為我已經衰老了”,每次都要求他的學生們收拾好為了讓他腰痛緩解臨時用沙發墊搭出的雨棚,這讓他們頗為手忙腳亂。在某次來訪中,Hinton面對着余凱落下了的背包還和學生糾結了半天是否要翻找其中百度底價的信息。但最終還是尊嚴讓他們作罷。最後,在一周時間后,Hinton接受了谷歌的報價,把這個還完全是空殼的公司以4400萬美元的價格賣給了這個巨頭,並掀開了巨頭AI戰爭的帷幕。
在他的職業生涯中,這樣充滿細節和戲劇衝突的場景處處可見。因此稱他為AI領域最深入的觀察者並不為過。
在這次訪談中,梅茨再次展示了他對與AI領域的廣博學識,從深度學習的歷史和核心時刻,談到AI的未來與對人類社會的影響。他還特別對中國的人工智能情況做出了他觀察家式的評價。
他認為Sam Altman之所以能讓OpenAI脫穎而出,主要在於其強大的談判能力促成了OpenAI和微軟的合作。他也認為中美在AI上的差距不如大眾所想的那麼遠,因為現有技術本身沒有什麼護城河。對於AI的未來,他有着和Hinton相似的憂慮,會擔心AGI的出現會給社會帶來巨大的變革。旁觀者清,以下是來自AI觀察者的灼見。
划重點:
騰訊科技:
現在關於OpenAI的故事已經成為人們關注的焦點,你在書中已經寫了很多關於它的建立和歷程的故事。你能談談Sam Altman嗎?是什麼品質使他能夠領導OpenAI走到今天的位置?
凱德·梅茨:
Sam 很有野心,他擅長說服人們做他想讓他們做的事情。坦白說,他擅長組建團隊,並讓他們走上特定的道路。這不僅僅是關於開發技術的水平。他們需要大量的資金來做到這一點。訓練這些類型的系統需要數千萬美元,甚至數億美元。我曾說過,分析所有的互聯網文本並學習,並讓這些系統自己學習,這需要花費數月時間,需要大型計算系統支持,而這些系統實際上是由大型科技公司擁有和控制的。
Sam大約在2019年就籌集了10多億美元。因此,他的相當一部分技能就是通過談判來促成這筆交易。這是一筆巨額交易,Sam獲得了他所需的資金,也獲得了他所需的算力。後來,他們從微軟籌集了另外的110多億美元,也就是總共籌集了近130億美元。這是他如此關鍵的一個重要原因。
騰訊科技:
您提到了微軟,但它在上一波人工智能浪潮中完全落後於競爭對手。那為什麼微軟在這波AI浪潮中能夠抓住這個機會,如此迅速的行動起來?
凱德·梅茨:
這對微軟來說是一個有趣的動作。他們曾經在這場競爭落後過,但他們意識到正在建立的技術的重要性。他們之前也遇到了很多困難,他的對手谷歌和其他公司有一個可以使用這項技術的場景:谷歌首先在安卓手機和它的数字助手Google Home上大規模部署了神經網絡,用於語音識別。因此,當你在家裡使用這些智能音箱時,它們可以回答你的問題。谷歌能如此快的開始部署這項技術,因為他們有可以部署它的場景和硬件。而微軟沒有這個場景。
但是,當微軟終於嘗試部署它時,他們還是遇到了別的問題。幾年前,他們在美國推出了一個名為Tay的聊天機器人,它幾乎一上架就開始產生一些冒犯人的信息,包括種族主義信息。微軟只能很快就將其下架了。
這是AI技術在美國發展過程中的故事的一面,因為這些系統有時會產生不必要的文本,這些文本對某些人有偏見,產生仇恨言論。因此大公司很難下決心推出這種產品,他們不想冒那樣的風險。但是微軟通過和OpenAI的合作,由OpenAI來推出這個系統,這樣人們就不會像對微軟那樣對其缺陷做出強烈的反應。人們會接受這些缺陷來自一個小而不知名的公司,但不會接受來自像微軟這樣知名的公司的缺陷。
騰訊科技:
根據你的觀察,中美在人工智能領域的差距有多大?你認為中國在人工智能方面有哪些優勢?
凱德·梅茨:
中國在這方面已經有一段時間的研究了。有很多人和公司了解這裏所涉及的技術,但也可能存在困難。訓練這些系統所需的計算機芯片,在最高水平上是由美國公司製造的。現在有貿易禁令,這些芯片不能銷售給中國。這可能是一個劣勢。
當涉及到構建這種技術時,我們將看到它如何發揮作用。Sam Altman最近表示,他覺得中國落後了兩年。這是一個估計。我認為,整個行業可以很快跟上他和他公司所做的事情。我們已經開始看到這種情況了,我認為這在中國也可以發生。
騰訊科技:
這種差距是在變大還是變小?
凱德·梅茨:
由於貿易禁令的原因,很難說清楚。這是一个中國面臨的困難。據我所知,中國正在努力建造、設計和供應數據中心所需的芯片和設備。
無論是在中國還是在美國,我們都將不得不面對貿易摩擦如競爭中發揮的諸多潛在作用。現在人們普遍認為,OpenAI的技術目前領先於大多數競爭者。但這個世界上仍有許多其他公司擁有着足夠的知識和資金,並可以接觸到所需的資源來進行真正競爭。
因此,在AI競爭上我們還處於早期階段,還有許多道路需要去探索。結果還需要等等看。
騰訊科技:
你在書中提到了百度。中國的這家公司也在2012年開始嘗試這種人工智能技術,這已經是這場競賽的早期階段了。你認為今天為什麼它沒有展現出優勢?你認為這種情況的主要影響因素是什麼?
凱德·梅茨:
我認為是想法在推動這個領域發展的。深度學習在全世界都很有名,中國的研究人員也建立了類似的技術。但就像在美國一樣,人們對也我之前提到的人類反饋訓練這一步驟的效果感到驚訝。因此,他們在將這種技術(人類反饋訓練)應用於大型語言模型方面比美國的許多人慢了一步。
騰訊科技:
你提到了很多其他公司也在這場競賽中,除了像OpenAI、Google和Meta這樣的大公司之外,還有哪些值得關注的小公司呢?
凱德·梅茨:
有一家名為Anthropic的公司,它由一群離開OpenAI的人創立的。這個公司不太知名,但在這個領域里他們將會變得很重要。他們幫助構建了許多形成ChatGPT的技術,並建立了自己的聊天機器人,但尚未向普通公眾發布。我估計它的能力會和ChatGPT相當。
在多倫多有一家名為Coherence的公司也正在做類似的事情;在美國有一家由前谷歌員工創立的公司叫做Character.AI;還有一家叫做Inflection AI的公司,是由DeepMind的創始人之一創立的。DeepMind是另一個位於倫敦的重要實驗室,基本上是由谷歌擁有的。
騰訊科技:
對於在AI細分領域發展的的公司,它們的機會在哪裡?
凱德·梅茨:
這些小領域的工作方式是,一旦有人構建了一個被稱為大型語言模型的系統,你就可以使用它來構建各種其他技術。你可以構建一個聊天機器人,你可以構建一個搜索引擎,你可以構建一個個人導師。因此,OpenAI正在做的是他們構建了這個核心繫統。他們稱之為GPT-4,然後他們向任何想使用它的其他企業提供這個系統。這是創建其他應用程序的一種方式。
這就是我們開始看到的。我認為你會看到像OpenAI這樣的公司提供這種服務。每個人都可以使用它在其上來構建自己的應用程序。因此,我認為有各種各樣的機會,公司可以利用這個核心服務,然後在其上構建新的東西並銷售這些應用程序。但是最難的是構建這個核心服務,沒有多少公司能夠做到這一點。在美國有谷歌、微軟、Meta等巨頭,另外只有少數初創公司擁有所需的資金和人才。就像我之前說的,你需要數億美元來構建這個核心繫統。因此目前對於小公司來說,在構建基礎模型方面與它們競爭是很困難的。
很多人認為,隨着價格的下降和開源項目的不斷改進,人們將更容易地構建自己的核心繫統,這種情況最終會發生改變。但我並不確定。
騰訊科技:
您作為一名資深的AI作者,在自己長達十幾年的職業生涯中基本上一直都在專註於深度學習這個領域,並結實了這個領域中的所有重要角色,參与了其間的各個決定性時刻。是什麼契機讓您關注到這個領域?
凱德·梅茨:
大約在2011年或2012年,我加入了舊金山的《連線》雜誌。這是我決定專註於的領域之一。在十多年前那個時候已經可以嗅到這個領域將會變得非常重要了。那時發生了幾個關鍵時刻,讓我對這項技術產生了興趣。
Hinton是《深度學習革命》這本書中的主角,我寫了一些關於他的崛起以及神經網絡這個關鍵概念的文章,正是這個概念推動了過去10年中許多進步的實現。他最終於2013年加入了谷歌。
後來我才知道,這是全球幾家最大的科技公司之間的一場競拍,包括谷歌、微軟和中國的百度等。那是一個關鍵時刻,你可以看到一些事情開始發生。多年來,我開始越來越多地報道這個領域,並認識了像Hinton和他的老同事Yann Lecun這樣的人,他最終加入了Facebook,現在是Meta,以及其他領域的人。我們開始在《連線》雜誌上進行大量報道,然後它的影響越來越大。最終,我決定寫一本關於這個領域的書,當我從《連線》雜誌轉到《紐約時報》時,我繼續報道這個領域。
騰訊科技:
作為長期跟蹤AI的記者,就像穿越了周期一般,你經歷了機器學習領域的低谷時期,在那段時間中明斯基的符號主義大行其道,深度學習被認為從原理上都不可能產生出有效的人工智能。在你看來是什麼讓辛頓等人堅持下來的?
凱德·梅茨:
Hinton在1972年開始研究神經網絡。在那時,幾乎沒有人相信它會成功,因為整個人工智能領域都放棄了神經網絡這個方向。但Hinton是一個有主見的人,真正相信自己的信仰,他堅定不移地堅持着這個方向。
到了80年代,很大程度上是因為Hinton 自己的努力,這項技術取得了一些重大進展。很多人開始重新相信這個想法。但到了90年代初,人們又放棄了,但他繼續工作,他一直保持着一貫的態度。他們相信這個想法會繼續改進,他們是正確的。這個故事之所以如此有趣,部分原因是即使在面對如此多的懷疑,甚至是來自他們親密的同事,他們仍然繼續工作。
真正讓整個行業大開眼界的時刻是現在被稱為AlexNet論文的那個時刻。這是由Hinton和他在多倫多大學的兩個學生撰寫的研究論文,展示了神經網絡在圖像識別方面可以取得很大的成功,可以識別照片中的物體,如花朵、汽車、人、動物等等。
當這篇論文在2012年發表時,它讓谷歌、微軟、百度和最終Facebook都大開眼界。我們能看到這場人才爭奪戰,看到這場將這個想法應用於地球上一些最大的公司內部的熱潮,不僅應用於圖像識別,還應用於語音識別、翻譯等等。那篇論文是一個關鍵時刻。這就是為什麼我的書以那篇論文為開端,那是Hinton將自己的公司拍賣給出價最高者的時刻,那引發了其他一切的發展。
從那時起一直到今天,我們一直在持續進步。上面提到的2012年的行業意識覺醒是一個關鍵時刻,而10年之後的此刻,ChatGPT發布了,這是另一個關鍵時刻。當我們回顧AI的歷史的時候,這兩個時刻都是非常重要的轉折點。
騰訊科技:
在您的書中,您描述了深度學習的發展過程,像AlphaGo、Deepfake和GPT系列這樣的產品里程碑式的產品都引發了廣泛的公眾討論。但直到ChatGPT出現,每個人才真正感到真正的工業革命來臨,到底是什麼讓GPT系列如此與眾不同?
凱德·梅茨:
這是一個很好的問題。GPT和ChatGPT的相關技術已經被開發了有一段時間了。在過去的五年中,幾家公司一直在開發這種技術,OpenAI最終開發了Chat GPT,谷歌、Meta(前Facebook)和微軟等公司也在五年前開始開發所謂的大型語言模型。
這個技術的基礎想法是建立一個神經網絡,一個可以從數據中學習的數學系統。盡可能多地輸入文本,然後它會分析這些文本,在分析這些文本的過程中,它學會了自己生成文本。通過分析維基百科文章、博客文章、聊天記錄和互聯網上的各種內容,它識別出了我們組合單詞的方式中的模式,並學會了這種方式。在過去的幾年中,我們看到了這種技術的成果,並且有好幾個有趣的系統被發布了。
OpenAI發布了GPT-2,GPT-3,它們都很令人印象深刻。我們可以看到這些系統開始像人類一樣產生文本。但真正讓普通大眾意識到這一點的是ChatGPT的發布。其他公司甚至在幾個月前、幾周前就已經發布了他們自己的聊天機器人,比如 Meta(前Facebook)在科學界發布了一個聊天機器人,但這對人們來說不僅無趣,而且還遭到嘲諷。因為它會產生虛假信息,人們對此感到非常不滿。Meta很快就將其下架了。但在那之後不久,OpenAI在Twitter上發布了ChatGPT。
它之所一下火爆的部分原因是發布方式,部分原因是發布公司。但ChatGPT確實在某些關鍵技術方面得到了改進。因為在構建這些從整個互聯網中學習的大型語言模型的過程中,他們將人類反饋應用於其中。他們讓人類評價這個聊天機器人的回答。他們讓人類評價一個回答是好的嗎?它是真實的嗎?它有用嗎?他們給它一個贊或一個踩,然後他們將這些評分反饋到系統中,並讓它從這些評分中學習。
通過這種方式,他們能夠將其磨礪到幾乎每次詢問聊天機器人時,它都會產生令人信服的文本。它可能不總是正確的,仍然會產生虛假信息,但它能夠以一種人類真正會用的回應方式與人們交流。不僅和是領域內的專家交流,而是任何人。這真正的抓住了人們的想象力。人們對這種技術的看法發生了實實在在的轉變,不僅是普通人,也轉變了很多這個技術領域的研究人員。ChatGPT的火爆開啟了這種類型技術的新時代以及一個朝着越來越令人印象深刻的人工智能進發的新競賽。
騰訊科技:
所以你認為,ChatGPT取得成功的技術關鍵因素主要是RLHF(人類反饋學習)?
凱德·梅茨:
沒錯,如果你使用一些過去的版本,比如GPT-3,當你用特定方式提問它時,有時它能令人印象深刻。比如你要求它用唐納德·特朗普的方式演講,大概有一半的幾率它會產出一個令人印象深刻的演講。這有點像擲骰子,有時它會給你想要的東西,有時它不會。在這種情況這個系統不會引起普通人的注意。但他們採用了這個基本系統,但每次系統產生一個回答時,他們都讓標註員對它進行評分。它可以從人類那裡獲取評分信息,了解他們如何評價這些回答,然後用這個來再訓練這個系統。標註員是在告訴GPT什麼樣的回答是好的,什麼樣的回答是不好的。
最終,OpenAI得到了一個聊天機器人,幾乎每次都能像人類一樣交談。他們把這個系統放在普通人面前,當下這種火熱討論就是人們回應它出現的方式。在Twitter上,任何人都可以使用它,人們真正回應了它。
騰訊科技:
前段時間馬斯克接受採訪時說AGI會在5,6年內實現,您覺得AGI會是一個唾手可得的目標嗎?
凱德·梅茨:
這確實很難說,在這個問題上有很多爭議。我們知道今天的AI系統還遠遠達不到那個水平。它們可以以令人印象深刻的方式產生語言,但它們無法像人類一樣進行推理,也沒有人類的常識。
很多人認為,我們需要新的方法來賦予它們這種能力,而我們目前的方法無法讓它們達到AGI。它們需要更多地了解物理世界,而不僅僅是了解語言。對於這個問題有很多爭論和分歧,但它肯定不是今天我們需要考慮的問題,目前我們也還不夠接近AGI。
騰訊科技:
您覺得現在的系統相較於真正的通用人工智能還欠缺什麼?
凱德·梅茨:
當使用這些系統時,可以很容易發現現階段AI的缺陷。如果試圖讓它們像人類一樣進行推理,有時它們可以模仿,但大多數時候它們做不到。
這是真正的難點。它們與AGI之間的最大差別在於,產生似是而非的文本和能夠真正地進行推理。
這些系統非常擅長處理過去發生的事情,也就是說一些在互聯網上有記錄的事情。但它們並不談論未來,並推測可能會發生什麼。你和我可以進行這樣的對話,我們在談論未來,思考可能會發生什麼。這些系統不擅長這樣做。它們擅長模仿它們以前看到的東西。因此它們非常擅長通過標準化測試。它們在法律考試、高中科學和數學考試等方面的表現非常出色,媒體也對此大肆宣傳。
但其他研究表明,如果你只給它們全新的問題,也就是在它們接受訓練之後編寫的問題,它們的表現就不如前。因此當它們回答所有這些標準化問題時,它們並不一定在進行推理。它們所做的是重複以前看到的東西。
騰訊科技:
關於AI的威脅,比如不透明性,您在書中記錄了Hinton說的一段有趣的話”人們需要忍受‘黑匣子‘問題,即使你看不到內部的運作機制,他們也會做他們應該做的事", 但最近Hinton退出谷歌,您也對他進行了採訪,在其中他表達了對AI的很多擔憂。您是如何理解Hinton對於AI態度的發生轉變這件事的?
凱德·梅茨:
他的想法肯定發生了變化。當我出版這本書時,他認為AI的風險相當遙遠。但在過去一年中,當他看到我們現在看到的ChatGPT這種技術時,他改變了想法。
他開始意識到在某些方面系統比人腦更強大。你和我無法理解整個互聯網,這是人力不可及的。我們無法從這麼多的數據中進行學習,但系統可以。他擔心它們被用於傳播虛假信息,在這種情況下,文本不是真實的,圖像不是真實的,視頻不是真實的。
除此以外,他還擔心繫統開始奪走人們的工作;也擔心某些更大的問題,比如自動化系統被用於戰場,被用作武器;他甚至擔心在更長的時間內,我們會失去對AI的控制。
騰訊科技:
Hinton 的老同僚Yann Lecun和其他人工智能科學家最近真的討論了很多關於媒體對人工智能能力和威脅的誇大。你認為他是對的嗎?媒體可能會以何種方式使這些事情變得比實際情況更加複雜?
凱德·梅茨:
我認為媒體確實存在誇張。當Chat GPT首次發布時,人們沒有看到它的缺陷,過了很久,他們才意識到它會產生錯誤信息來誤導人們,包括記者在內的很多人都很難理解到底發生了什麼,因此,他們在傳播過程中會繼續對人們產生誤導。在這種情況下,很容易發生過度炒作。
當然,有時候故意的誇大來自於誤解,但有些人會故意炒作,有些人則是無意識地。但我認為,大部分還是因為人們並不完全理解他們所看到的東西。
騰訊科技:
你認為當前人工智能繁榮的歷史意義是什麼?它是新工業革命的開始嗎?
凱德·梅茨:
這是有可能的。我認為我們將會繼續看到這些系統的改進。它們將能夠處理不僅僅是文本,還有圖像。我們已經看到OpenAI構建的最新版本技術可以接收圖像並描述其中的內容,回答有關它的問題。這還沒有公開,但這是他們所構建的一部分。它越來越多的技能將類似於人類,並不斷改變人們的工作。
因此,我認為過去6個月所看到的一切表明,未來幾年我們將迎來一個真正的大變革。這一變革看起來確實會像第一次工業革命一樣產生深遠的影響。我們還處於早期階段。這些事情往往比人們想象的進展緩慢。但我認為我們正在朝着這個方向前進。
騰訊科技:
您覺得從AI將會如何重塑這個社會?在AGI實現之時人的價值在何處?
凱德·梅茨:
我認為如果真的擁有一個能做任何人類大腦可以做的事情的系統,也就是所謂的AGI,對人類來說那將是一個困難的處境。
如果機器可以做人類的所有事,那麼工人的價值就會降為零,因為使用機器比雇傭人類更便宜。在我看來,這對人類來說並不是個好處境。但現在AI還沒有到那個地步。
以計算機程序員為例,今天,系統可以很好的生成計算機程序和計算機代碼,但代碼可能仍然存在缺陷,還是需要一個有經驗的人類程序員來接手他們生成的代碼,並將其編輯、整合到更大的程序中,最終構建一個應用程序。隨着時間的推移,這些系統變得越來越好,它們會越來越多地取代人類所做的事情。現階段的問題是,AI很快就會開始取代那些經驗不足的初級程序員,那些處於程序員行業底端的人,他們做的事和AI差不多,寫一些基礎代碼並將其交給更有經驗的人去整合。
隨着AI的不斷改進,機器肯定會越來越多地改變事情,但我們還沒有到當下就靠AI突然取代大量工作的地步。
另外一個我的擔憂就是這些系統可以生成逼真的文本和圖像。它們甚至正在開始即時生成視頻,我們將無法分辨互聯網上的真實和虛假,並且會不得不改變我們在瀏覽互聯網上幾乎任何東西時的心態。你必須問問大眾是否有能力從整體上改變他們的思維方式。