所有語言
分享
來源:雷科技
沒那麼簡單。
圖片來源:由無界 AI生成
雖然在 2023 年,OpenAI 已經在移動端推出了 App 版的 ChatGPT,可以讓用戶在手機上更方便地使用 ChatGPT 的對話服務,年底的時候還宣布 App 版上的語音功能已經免費開放給所有用戶。
但又必須得說,作為一個「AI 助手」,ChatGPT 在手機上還是不夠方便,不信你比較下手機自帶的語音助手,通常是一鍵、一劃、一呼就能呼出進行對話,肯定要比打開 ChatGPT App、點擊語音或者輸入框進行輸入來得方便。
OpenAI 也看到了這一點。
在上個月,也就是 2023 年 12 月更新的 1.2023.352 版本中,Android 端的 ChatGPT 添加了「com.openai.voice.assistant.AssistantActivity」的新活動,直接指向了 Android 系統的語音助手功能。此外,該版本還加入了一系列的相關代碼和信息。
雖然上述的新活動還沒有正式啟用,就算強行啟用,也只會出現尚未完成的動畫,然後……就沒有然後了。但毫無疑問,OpenAI 不可能無緣無故加入這些代碼和信息。
圖/ Android Authority
不出意外,我們在不久后就會看到 Android 端的 ChatGPT 將可以設置為「默認助理應用」,用戶通過平時呼出系統自帶助手的方式,比如長按電源鍵或是手勢操作就能呼出 ChatGPT,並直接進行語音對話。
從這個角度來看,留給谷歌助理、蘋果 Siri 以及 OPPO 小布等手機 AI 助手的時間不多了……嗎?
OpenAI 最早在 2022 年 11 月底上線了網頁端的 ChatGPT,很快就在科技圈掀起了一輪「旋風」,其中最核心的一點在於強大的自然語言理解能力,通俗來講就是:聽得懂人話,說得了人話。
緊接着,ChatGPT 引發的浪潮愈演愈烈,席捲了從各國政府到各個行業,僅兩個月後的月活用戶就突破了 1 億大關。與此同時,無數人也看到了 ChatGPT 背後大模型技術的廣泛應用前景,大模型層出不窮,應用層也在進行尋找和探索。
手機 AI 助手就是最早被看到的機會之一。
3 月,微軟 CEO 薩蒂亞·納德拉就對英國《金融時報》吐槽,蘋果的 Siri、亞馬遜的 Alexa,微軟自家的 Cortana(中文名:小娜)以及公認拔尖的 Google Assistant,這些語音助手有一個算一個:都笨得跟石頭一樣。
納德拉,圖/微軟
Siri 的聯合創始人 Adam Cheyer 也承認,ChatGPT 理解複雜信息的能力讓現有的語音助手看起來很蠢。這是問題,也是機會。
年初我們就在《ChatGPT 能讓 Siri 和小愛同學變聰明嗎?》一文中介紹了一些個人開發者的嘗試——將小愛同學、Siri 等常用手機助手接入 ChatGPT,當時我們也作出了判斷:巨頭的入場,不遠了。
到下半年,手機廠商陸續在大版本系統升級中加入了大模型加持的小藝(華為)、小布(OPPO)、小愛(小米)、小 V(vivo),谷歌正在開發本地接入 Gemini 大模型的谷歌助理。就連「一向不趕時髦」的蘋果,也被傳出正在將生成式 AI 整合到 Siri 中,預計將在今年 WWDC 上正式亮相。
趨勢來了,擋也擋不住,順勢而上才是王道。
圖/ OPPO
但另一個問題是,算力更強、更「聰明」的 ChatGPT(OpenAI)、Copilot(微軟)、文心一言(百度),還有更多類 ChatGPT 的 AI 對話服務總歸也要面對同一波的趨勢。
在 Google Play 上,ChatGPT 的下載量早就超過了 1000 萬次,評分有 4.7,在 App Store 的評分更是 4.9。高評分的背後,是大部分用戶的好評、認可,更是 GPT-3.5/4 在模型輸出質量上的水平體現。
圖/蘋果
相比之下,手機廠商雖然普遍開始在系統自帶 AI 助手上接入雲端、端側大模型,但用戶評價並不高,在邏輯推理、語言理解等各方面的能力都較弱。
實際上,廠商也不可能去訓練和採用太大參數規模的模型,核心是成本太高又很難建立合理的收費模式。試想一下,ChatGPT、文心一言等可以採用訂閱收費的方式,但系統自帶 AI 助手很難說服用戶付費訂閱,甚至容易引起聲討。
換言之,手機廠商自己的 AI 助手,很難和 ChatGPT 比「智能」。但手機廠商也有自己很大的優勢。
我們之前就多次談過「端側大模型上機(手機、PC)」的必然趨勢,比如在《重新定義智能手機,大模型會是手機廠商的偽命題嗎?》中就指出:
端側大模型的數據處理都在端側,用戶的個人數據將不會上傳至雲端服務器,用戶才會放心將數據交給 AI 去學習,這才能為手機 AI 助手真正成為個人助理提供了先決條件。
其次,雖然在 Android 上谷歌很早就向第三方開放了語音助手的權限,用戶可以將第三方語音助手,如微軟小娜、三星 Bixby 等設置為默認語音助手,可以很方便地呼出,但實際上第三方應用獲得的權限、接口還是無法與自帶的谷歌助理相比。
圖/ Gadget Hacks
換言之,ChatGPT 就算後續支持設置為默認語音助手,實際在系統層面的影響力可能還是有限,無法像自帶 AI 助手通過指令對系統進行一系列的操作,比如語音跳轉導航、提醒事項等。或許,ChatGPT 能夠得到最大的好處也就是可以更便捷的呼出了,這當然也很關鍵,但始終很難藉此成為用戶真正的「数字助理」。
而這還是「最開放」的谷歌,蘋果和 OPPO、華為、小米等國產廠商,更不會在系統層面開放給類似 ChatGPT 等第三方應用。去年 WWDC 上,蘋果宣布用戶呼出 Siri 不用再「Hey Siri」,只要說「Siri」就行了;國產手機廠商過去幾年也在不斷降低自帶 AI 助手的使用門檻,加入更多的功能。
在手機這片江湖中,過江龍還是很難直面地頭蛇。
當然了,科技行業的顛覆往往不是從中心,而是從邊緣發起的。
圖/ OpenAI
1 月 5 日,The Verge 拿到一份發自 OpenAI 的郵件显示,醞釀已久的 GPT 商店將於下周正式上線,GPTs 的開發者們屆時可以上架「售賣」自己的 GPT(基於 GPT-4),從中獲利。(關於 GPTs 計劃,這裏可以參見雷科技文章《ChatGPT 的 2023:開創人工智能的新紀元》,其中就一部分介紹。)
再加上 ChatGPT 已有的插件生態,你很難說這會不會是又一次「App Store 式」的變革,並且顛覆現有的計算系統:到時候可能就是降維打擊了。