所有語言
分享
編譯丨海倫 無忌
來源:騰訊科技
圖片來源:由無界 AI工具生成
丨划重點
① AIGC 火了,但在最近這波競爭浪潮里,蘋果早些年推出的主打語音智能的 Siri,處境卻並不理想。
② Siri 團隊面臨的問題,除了底層數據庫的問題,還有產品設計分歧、內部權力鬥爭、人才流失嚴重等情況。
③ 雖然人工智能專家詹南德雷亞如同救星般從谷歌跳槽到蘋果,但 Siri 的發展仍受制於內部地盤之爭。
④ 蘋果比任何公司都注重維護自己的形象和品牌,AI 語音助手的設計可能涉及到用戶的隱私數據問題,這讓蘋果在開發中一直畏手畏腳,未能趕上谷歌和微軟。
最近幾個月,以語音交互為首的 AIGC 火了,各家科技巨頭公司都在爭先恐后紛紛推出自家的大模型產品。而提到 AI 語音交互應用,多年前在 iPhone 手機中便推出了智能語音助手 Siri,在這波競爭浪潮里似乎“落單”了。對此,甚至有行業人士和媒體喊話:“嘿蘋果,你的聊天機器人在哪裡?”
對於蘋果在 AI 競爭中可能會面臨掉隊的危機,近日,有國外媒體撰文指出了蘋果公司內部存在的一些問題:蘋果在 Siri 和人工智能方面的工作內部存在混亂和缺乏雄心,導致了蘋果在改進 Siri 和其背後的技術方面落後於主要競爭對手谷歌和微軟。
在去年 11 月,OpenAI 推出聊天機器人 ChatGPT 之後,就一直吸引着公眾的目光。此後不久,曾幫助蘋果改進搜索技術的三名工程師便開始着手研究 ChatGPT 背後的技術類型。但對蘋果而言,還存在着一個關鍵問題:這三名工程師已不在公司任職。離職之後,他們轉投谷歌從事被稱為大型語言模型的技術開發。
據知情人士透露。這三位工程師 -- 斯里尼瓦桑・文卡查里(Srinivasan Venkatachary)、史蒂文・貝克(Steven Baker)和阿南德・舒克拉(Anand Shukla),他們去年秋季離開了蘋果,部分原因是他們認為谷歌是研究能夠理解語言併產生類似人類反應的大型語言模型的更好企業。
無論是蘋果還是谷歌都對上述三人青睞有加。
據兩位與文卡查里談論此事的人透露,谷歌非常希望他們加盟,公司首席執行官桑德爾・皮查伊(Sundar Pichai)甚至親自向他們示好;而蘋果首席執行官蒂姆・庫克(Tim Cook)也曾試圖說服他們留在公司。知情人士稱,他們現在正在努力降低谷歌的訓練成本,提高大型語言模型和基於這些模型的產品的準確性。
文卡查里等三人的離職對蘋果人工智能高管約翰・詹南德雷亞(John Giannandrea)是又一次打擊。詹南德雷亞 2018 年從谷歌跳槽到蘋果,幫助蘋果成為人工智能領域的重要參与者。
在外媒對三十多名曾在蘋果人工智能和機器學習團隊工作的前蘋果員工的採訪中,由於核心的骨幹的離職,該部門面臨了組織功能障礙和影響了團隊的信心。這些問題引發了人們的疑問,隨着 ChatGPT 等更複雜的人工智能技術的起飛,蘋果的產品會有多大競爭力?
多名前 Siri 員工表示,在蘋果內部,自詹南德雷亞接手以來,Siri 仍因一些未解決的功能障礙和進展緩慢問題而受到嘲笑。有不少員工嘲笑 Siri“過於笨拙”,甚至有團隊想要直接放棄 Siri。知情人士透露:包括蘋果混合現實頭顯負責人邁克・洛克威爾(Mike Rockwell)在內的項目開發團隊,都對 Siri 團隊展示語音助手如何控制頭顯的演示感到失望。知情人士稱,洛克威爾的團隊一度考慮建立替代方法,用語音命令控制頭顯(該團隊最終放棄了這個想法)。
截至目前,在人工智能研發和創新上缺乏進展似乎還沒有嚴重傷害到蘋果。這家公司仍然是全球市值最高的公司,市值達到了 2.6 萬億美元。但是,像 ChatGPT 這種使用大型語言模型的產品的出現,可能代表着技術上的分水嶺,這將從根本上改變人們與網絡世界的互動方式,並創造齣電影、計算機程序、PPT 等一切產品。產品中不採用該技術的公司可能會在競爭中處於劣勢之中。“未來最有用的設備將使用大型語言模型,”人工智能搜索引擎 You.com 的首席執行官理查德・索徹(Richard Socher)說,“對自然語言的深刻理解將成為設備的一個賣點。”
儘管蘋果的主要競爭對手,包括微軟、谷歌、亞馬遜和 Meta,都宣布了基於大型語言模型的產品計劃,但 iPhone 製造商蘋果仍保持沉默。但這種情況可能會在不遠的將來發生改變,據知情人士透露,蘋果工程師提議對依賴大型語言模型的 Siri 進行一系列改進,他們希望這些改進能為明年 iPhone 操作系統的重大發布做好準備。
在擁抱最新的人工智能技術的態度方面,蘋果可能會比其競爭對手更加謹慎。沒有任何一家公司比蘋果更注重維護自己的形象和品牌。谷歌和微軟的聊天機器人表現出的怪異、有時甚至是敵意的行為和錯誤,在蘋果看來是絕不可恕的事情。
谷歌首席執行官 Sundar Pichai 在去年的一次公司活動中,演示語音助手的功能進展
蘋果前員工表示,出於這個原因,與目前各大巨頭推出的語音助手不同,為避免一些語音 助手回答失實等“尷尬事件”的發生,Siri 的大多數回答都是由人工編寫、審核或編輯的。據參与 Siri 開發工作的人士透露,蘋果高管過去曾否決過投資讓 Siri 擁有長時間來回對話能力的提議,認為這種功能很花哨,難以控制。
此外,蘋果面臨的另一個挑戰是該公司在隱私問題上不妥協的立場。在過去十年中,庫克一直把隱私作為蘋果設備的一個重要標籤和名片。比如蘋果在過去幾年裡一直在取消和限定許多 Siri 功能,如音量控制、打開應用、鬧鐘設置和聽寫筆記等,因此用戶必須在蘋果設備上手動完成,這限制了使用 Siri 的頻次。目前,大型語言模型 -- 尤其是那些支持 ChatGPT 等複雜服務的大型語言模型 -- 都在雲端運行,如果能讓 Siri 支持這些功能,短期內是很難實現的。
如果蘋果想要實現在語音助手方面的飛躍提升,用戶隱私數據可能將面臨難以得到有效的保護,對於蘋果來說,這是一個“進退兩難”的選擇題。關於機器學習的書籍《大師算法》(The Master Algorithm)的作者、華盛頓大學計算機科學教授佩德羅・多明戈斯(Pedro Domingos)對此表示,“蘋果的劣勢將變得越來越明顯。為與其他公司更好的競爭,蘋果將不得不使用更多的私人數據。”
不過,至少蘋果公司目前還能在這波浪潮變革下“處亂不驚”。ChatGPT 的出現讓其他大型科技公司更加不安,尤其是谷歌。這家公司如今正匆忙應對着 ChatGPT 越來越受歡迎的局面。如果蘋果願意,它有硬件專業知識和資源來訓練複雜的大型語言模型。
但是,對於 AI 語音助手的使用能力,蘋果是極為謹慎和擔憂的。蘋果高層因為擔心出現負面新聞,因此對 Siri 在回答問題時出現重大失誤較為保守,這直接影響了相關功能的開發進度。2019 年初,印第安納州一名 13 歲的男孩被警方逮捕,主要原因是他他曾告訴蘋果語音助手:“我要在學校掃射”,並且在網上曬出了了一張 Siri 推薦附近學校列表的截圖。
一名前 Siri 員工說,“儘管警方後來確定該男孩無意槍擊一所學校,但這一消息引起了蘋果高層的注意,他們要求 Siri 小組立即解決問題”。該員工表示,對於這件事,團隊很快在助手的軟件中硬編碼了新規則,以防止 Siri 將來對這樣的提示做出反應。這次印第安納州事件帶來恐慌,並不是包括首席執行官庫克在內的蘋果高管第一次親自要求 Siri 團隊修復尷尬的回應。前員工表示,他們不斷收到蘋果高管的通知,指出 Siri 的錯誤或需要糾正的問題。
基於過去幾個月 ChatGPT 和類似服務出現的尷尬事件,蘋果高層顯然不希望同樣的問題也出現在蘋果,這些事件也使得蘋果人工智能團隊的許多前員工都懷疑該公司能否成功開發出下一波基於大型語言模型的人工智能產品。前 Siri 員工說:“這種敏感性解釋了為什麼大約 20 名作家要創作或審查許多 Siri 的回答,且每個季度都花大量時間給出新的答案。蘋果前員工表示,與亞馬遜的 Alexa 或谷歌助手等其他語音助手相比,Siri 的反應在更大程度上依賴於人類的參与。”並且,蘋果對 Siri 的互動進行了“限制性的回答”:例如,詢問 iPhone 價格的用戶會被導向一系列網站,包括蘋果自己的網站,而不是給出價格。
另外,對於 Siri 的回答內容,在蘋果內部也產生了不少分歧。例如 Siri 設計團隊希望該功能的答案近乎完美,而工程團隊則希望準確率接近 80%。據四位熟悉 Siri 功能的人士透露,工程師們還花了幾個月時間說服 Siri 的設計者,並不是它的每一個答案都需要人工驗證,這一限制將使 Siri 無法擴展到回答用戶提出的大量問題。一年後,設計團隊放棄了這條規則。
前 Siri 員工說,設計團隊的高標準讓蘋果的一些機器學習工程師感到沮喪,他們認為他們的模型註定會出錯,改善它們的唯一方法是將它們放歸自然,並逐漸調整。這與蘋果設計團隊的文化背道而馳,眾所周知,他們告訴工程師要等幾年時間來完善產品,然後再發布。
在一次全體會議上,蘋果人工智能和機器學習團隊的領導人談到了這種緊張局勢,他們一致認為錯誤是必然會發生的,而他們的工作是教育蘋果的高管如何改進機器學習模型。據一名前 Siri 員工說,詹南德雷亞和文卡查里領導的搜索團隊最終能夠與 Siri 設計團隊達成妥協——通過創建一個按鈕,允許用戶報告對 Siri 答案內容的擔憂或問題。根據另一位員工補充“其實 Siri 的設計團隊曾拒絕這一功能,部分原因是他們想保持 Siri 無所不知的形象。”
可以看出,對於 Siri 的設計,在蘋果內部存在了諸多意見。而蘋果的內部爭權奪利也給 Siri 的推進帶來了阻礙。對此,我們來回顧蘋果近十年 Siri 內部的鬥爭:
在 2011 年,當蘋果將 Siri 作為其 iPhone 操作系統的一項功能推出時,這似乎標志著人工智能的一個轉折點。蘋果通過收購初創公司 Siri 獲得了這款產品,讓快速增長的數億 iPhone 用戶可以隨時使用它,完成如設置日曆提醒和使用語音命令編寫短信等簡單的任務。
但當人工智能高管詹南德雷亞在 2018 年加入蘋果時,高層領導之間進行過了“小規模的權利爭鬥”,並對助手發展方向的激烈爭論,使得 Siri 團隊很早的陷入混亂之中。據當時在該部門工作的人說,蘋果高管當時認識到了問題所在,並試圖通過聘用詹南德雷亞來扭轉局面。
從谷歌挖來詹南德雷亞被視為“蘋果的妙招”。多年來,蘋果一直難以吸引人工智能領域的頂級人才,而鑒於谷歌在長期研究方面的投資,大多數人工智能頂級人才更喜歡谷歌。詹南德雷亞在谷歌一路晉陞,成為該公司的高管之一,負責監管人工智能和搜索等業務。他的到來當時曾令蘋果員工感到興奮,因為許多人希望他能像救世主一樣改變現狀,幫助 Siri 趕上競爭對手。
從領導風格到政策轉變,當時詹南德雷亞的到來,很快為蘋果帶來了變化。與 58 歲的詹南德雷亞一起工作的人形容他——“雖然說話溫和,但很有魅力,並且在業餘時間喜歡修修補補(知情人士透露,他的愛好是拆卸原子鍾)”。
前 Siri 員工說,詹南德雷亞 -- 被同事們親切稱為 J.G.(名字的首字母縮寫),藉以區分他與蘋果高管層中普遍存在的 A 型人格(A 型人格者總願意從事高強度的競爭活動,不斷驅動自己要在最短的時間里干最多的事,並對阻礙自己努力的其他人或其他事進行攻擊。)
在蘋果公司,高層經常會在開會時批評譴責普通員工。
據一名前員工稱,雖然蘋果高管希望 Siri 團隊在使用機器學習的功能方面取得顯著進步,但詹南德雷亞降低了這些期望。例如在會議上,他經常使用“爬山算法”這個短語來描述他解決人工智能問題的方法。據多位與他一起工作的人說,這涉及到頻繁的微小變化,隨着時間的推移,這些變化會累積起來。
在某些方面,詹南德雷亞也試圖讓蘋果更像他的老東家谷歌,目的是招募和留住人才。據之情人士透露,詹南德雷亞給下屬更多工作上的自由,讓他們可以去做自己感興趣的事情,而不需要證明自己的工作是正確的。他為蘋果公司的研究人員創建了一個正式的發表論文的流程 -- 過去,蘋果高管並不贊成員工這樣做。包括一名招聘人員在內的多名谷歌前員工表示,他還大幅提高了團隊中一直低於競爭對手的薪資,並帶來了許多與他在谷歌共事的人。
在詹南德雷亞履新后不久,他成功的以 1.55 億美元收購了 Laserlike,這是一家由文卡查里、貝克和舒克拉創辦的初創公司,詹南德雷亞與他們之前在谷歌工作時就認識。詹南德雷亞與文卡查里的私交不錯,並親自前往 Laserlike 的辦公室,聽取該公司內部的交易公告。據一位在場的人稱,那天他宣布,這家初創公司將幫助蘋果顯著提高 Siri 的搜索能力。
文卡查里加盟后成為蘋果搜索部門的負責人。多名前 Siri 員工表示,作為代號為“Pegasus”的項目負責人,蘋果給了他很大的自由,讓他擯棄蘋果的舊搜索技術,從頭開始重寫。該團隊是蘋果首批使用 Transformer 模型的團隊之一。(Transformer 模型是由谷歌首創的一種深度學習,可以更好地理解單詞之間的上下文和關係。)
在 2019 年,蘋果發布了 Laserlike 團隊的新 Siri 功能,該功能通過合成網絡信息來回答用戶的問題。不過,四名接受採訪的前僱員說,這項功能已經在谷歌的搜索結果中存在多年了,它幾乎沒有影響 Siri 的使用。
在詹南德雷亞的領導下,蘋果還收購了其他人工智能初創公司,以便在內部引入更多專業知識。然而,這些創業公司的創始人和員工在一些情況下最終離開了蘋果,就像 Laserlike 創始人一樣。其中一些人在採訪中表示,他們離開的另一個因素是蘋果在決策方面太慢,或者對新的人工智能技術(如大型語言模型)的態度太保守。
在某些情況下,詹南德雷亞的新員工遇到了似乎難以逾越的“官僚障礙”等內部鬥爭問題。例如,他在 2019 年招募了另一位密友亞瑟・范霍夫(Arthur van Hoff),探索從頭重寫 Siri 的項目。
根據一位 Siri 員工表示,這項代號為“黑鳥”(Blackbird)的工作包括創建一個輕量級版本的 Siri,將更多功能的創建委託給應用開發人員。這個應用在 iPhones 上運行,而不是在雲端運行,提高了 Siri 的速度和性能,同時增強用戶隱私。因為它的響應速度很快,黑鳥的演示讓 Siri 團隊的員工感到興奮。
但是,黑鳥與 Siri 的兩位長期高級領導者的工作展開了競爭:亞歷克斯・阿塞羅(Alex Acero)和羅比・沃克(Robby Walker),他們分別負責幫助 Siri 理解和回應查詢的兩個重要團隊。阿塞羅和沃克的項目代號為“Siri X”,旨在出於用戶隱私原因等將 Siri 處理軟件移動到設備上。
知情人士表示,Siri X 的目標只是複製 Siri 的現有功能,而沒有黑鳥更雄心勃勃的目標。不過最終,阿塞羅和沃克還是贏了。他們指派了數百人參與他們的工作,從而控制並消滅了黑鳥。因此黑鳥項目也告一段落。
當詹南德雷亞加入蘋果時,他的目標之一似乎很簡單:改善蘋果對數據的使用,目標是讓其人工智能產品變得更好。由於為了保護用戶的數據隱私問題,使得蘋果收集的 Siri 指標面臨很多缺口,許多 Siri 工程師對一些用戶的基本數據細節一無所知,比如有多少人在使用 Siri,以及他們使用的頻率,也因為 Siri 的領導層不想投資建立測量和分析 Siri 使用情況所需的內部工具。
在詹南德雷亞到任后,他批准了預算,大幅增加蘋果雇傭的承包商數量,從而對用戶查詢和 Siri 的回應進行評級。在這個過程中,承包商每天要梳理成千上萬個查詢,以確定用戶的意思,然後按照 1 到 5 的等級對 Siri 理解他們的語音並做出回應的成功程度進行評級。這些數據可以被輸入機器學習模型,用來訓練和改善服務。在詹南德雷亞的監督下,負責評分的數據科學和工程團隊從幾個人發展到一百多人。
然而,這種安排在 2019 年年中成為一個問題。此前有報道稱,蘋果承包商在 Siri 用戶不知情的情況下收聽他們的錄音。詹南德雷亞密切參与了對醜聞的回應。蘋果暫停所有評分工作三個月後,該公司用全職員工取代了承包商,並修改了內部政策,讓員工更難聽到 Siri 錄音。
但是,據 Siri 的前員工表示,評分工作被員工看作為“浪費時間和金錢”。Siri 幾乎沒有人使用數據科學和工程團隊的評分,負責自然語言、搜索和語音識別的 Siri 團隊更喜歡使用他們自己的評分員,他們可以根據自己的需求專門定製他們的工作。
對於 ChatGPT 帶來的這波衝擊,Siri 並不是唯一陷入困境的語音助手。
比如,去年 11 月有報道稱,亞馬遜 Alexa 部門當年運營虧損已超過 30 億美元,目前只是在維繫存在感。顯而易見的是,如果蘋果想化解這場危機,不論從技術還是內部問題上,公司都面臨着很大的挑戰。