所有語言
分享
原文來源:雷科技
圖片來源:由無界 AI生成
坦白講,小雷對微博之夜一向不關注,但最近两天也不得不被吸引,倒不是因為哪一位明星、紅人,而是作為微博之夜合作夥伴的 OPPO 進行了一輪宣傳,展示了一些利用生成式 AI 技術消除照片中部分物體的樣張。
比如拍攝辛芷蕾(《繁花》李李飾演者)手持 Find X7 Ultra 的這張,用 AI 自動消除右側的手臂和左下角的遮擋物。
圖/ OPPO
又比如這張傳播到已經有「电子包漿」版本的照片中,也用 AI 消除了左側的攝影燈,保留模特和燈光氛圍。
圖/ OPPO
再有在這張照片中,通過 AI 消除去掉了旁邊多餘的人,保留了被攝主體和背景。
圖/ OPPO
14 日凌晨,微博 CEO 王高飛(@來去之間)還轉發了 OPPO 中國區總裁劉波的微博,其中一張就是它。
圖/微博
AI 消除功能其實一點都不稀奇,在 2021 年甚至更早,華為、谷歌、小米等廠商就看到了很多用戶手機里因為各種遮擋導致的「廢片」,並順勢推出了 AI 消除功能,谷歌的「魔術橡皮擦」、小米的「魔法路人消除」都一度引起過網上的熱議。
魔術橡皮檫(谷歌相冊),圖/谷歌
不過也必須要說,比起三四年前 AI 消除的效果和能力,今天 AI 的水平顯然高了不止一個檔次,就說 OPPO 放出的樣張,乍看之下幾乎看不出任何 P 圖痕迹。
但你以為小雷要吹 OPPO 了?實則不然。
因為進步的不只是 OPPO,在最新生成式 AI 技術的加持下,谷歌、小米等廠商的 AI 消除能力也都迎來了質的變化。
圖/雷科技
比如小雷今天上午用小米 13 拍這張,畫面里有不少行人,通過澎湃 OS 上的 AI 自動消除功能,同樣也能實現比較好的效果。
生成式 AI 帶來的當然不只是自動消除照片「障礙物 」的功能,從更大的角度,憑藉 AI 對於語言、圖像理解的飛躍性進步,我們很可能在未來幾年看到,新一輪的 AI 浪潮將徹底改變大眾對於手機影像的理解,甚至是智能手機產品本身。
數碼發燒友應該還對幾年前的華為「月亮門」記憶深刻。
最初,華為宣稱可以通過 P30 Pro 拍到清晰的月亮照片,而第一批上手的人也「發現」P30 Pro 拍攝的「月亮」照片確實很清晰。
但有媒體很快在實驗中發現 P30 Pro 拍出了很多不存在月亮細節,質疑華為直接是將月亮細節 P 上去,完全不能代表其算法和影像實力。
事情的真相併不複雜,很多測試都能發現 P30 Pro 在月亮模式下確實存在「P 圖」的情況。但除了「月亮門」事件本身,事件還引發了關於「計算攝影的合理使用範疇」的大量討論,無數攝影愛好者、普通手機攝影用戶都在發表自己的看法。
不過今天回頭來看,當時人們對於計算攝影的想象力還是太小了。
2022 年 AI 繪畫剛火的時候,互聯網上已經有一部分人開始或擔憂、或調侃地說:AI 要上位了,畫師和攝影師要退位了。
到了 2023 年,AI 生成的照片《電工》已經獲得了索尼世界攝影大獎的冠軍,另一部 AI 繪畫作品《太空歌劇院》也奪下了美國科羅納州博覽會「数字藝術」單元的一等獎。
不僅是在各類評選大獎上,AI 也開始實質性地影響創作市場,影響到大量中低水平創作者的工作和生活。
截止到目前,DALL·E 已經更新了第三版,Midjourney 也升級到了 V6,兩大圖像模型的生成圖像質量比起年初驚艷世人時,又提高了不止一個檔次。
這種變化從一開始就註定要改變手機攝影的方式。從 AI 重繪(比如 AI 動漫:用動漫風格重繪照片)到 AI 擴圖,再到 AI 消除,手機廠商也註定需要重新改造照片功能,甚至重新思考未來手機影像的發展路徑。
7 月,美圖在齊發 7 款基於旗下視覺大模型——奇想智能的 AI 工具之後,很快又在美圖秀秀就上線了「AI 移除」功能,基於生成式 AI 技術,用戶只要「框選」或「塗抹」就能自動移除照片中不需要的元素。
10 月,谷歌宣布搭載 Tensor G3 芯片的 Pixel 8 Pro 將支持離線運行「魔術橡皮擦」,通過端側大模型的計算推理,更多基於圖像生成而非融入背景的方式達到更好的物體消除消除。
同月底,小米在澎湃 OS 內測的社區貼中宣布,「小米 AI 編輯」功能首批應用大模型,功能包括智能擴圖和魔法消除 Pro,前者可以實現對構圖不好的圖片進行擴展和自動構圖,後者可以實現對遊客照中的路人進行無痕消除。
圖/小米社區
之後我們又看到了 vivo X100 系列、OPPO Find X7 系列陸續發布,兩款手機也都是通過大模型技術實現 AI 消除的功能。
誠然,即便在 OPPO 最新放出的樣張中你也能發現,基於大模型的 AI 消除也並不完美。比如在這組同一場景的樣張中,背景牆玩偶的腳就被大模型「猜錯」了。
說到底,生成式 AI 的底層邏輯就是基於各種信息的推測,當然也會存在推測錯誤的情況。但公允地說,如今 AI 消除功能(基於大模型)的效果和適用性毫無疑問都實現了大踏步的進步。
而且不止於拍后編輯,在 Pixel 8 Pro 內置了一個專門用於圖像處理的模型,可以為圖庫中放大之後的圖片生成更加清晰的細節。
甚至,我們可以想象在手機上建立專屬的人像模型。
作為國內可能第一個破圈的 AI 原生工具,妙鴨相機雖然熱度早已不再,但依然有很大的參考價值。眾說周知,妙鴨相機在生成 AI 寫真之前需要用戶先上傳超過 20 張真人照片,以此生成專屬人像模型。
寫真不關鍵,關鍵是真人模型,圖/妙鴨相機
比起在妙鴨相機在雲端建立人像模型造成的隱私擔憂,在手機上使用端側大模型無疑是更好的選擇。在建立個人人像模型之後,用戶不僅可以生成寫真,也可以模擬不同地方的旅行照片(如去)或者其他用途。
而更進一步,生成式 AI 技術要改變也不只是手機影像。
2023 年春季釘峰會上,釘釘宣布全面接入千問大模型,要用一條「/」(斜桿)解決所有問題。釘釘總裁恭弘=叶 恭弘軍當時就坦言,釘釘的產品非常臃腫,但智能化給了一個機會去實現換道超車。
金山辦公 CEO 章慶元也說,Office 一直是很複雜的,很多功能的學習成本很高,AI 能大幅降低使用門檻。
釘釘也好,WPS 也罷,其實都是看到了生成式 AI 在「智能湧現」后帶來的人機交互革命,過去、現在和未來開發的所有功能,至少不會在圖形交互層面成為用戶的學習門檻和負擔。
智能手機其實也一樣。
都說智能手機很「傻瓜」,但實際上很多智能手機對於中老年用戶並不算特別友好,更遑論對障礙人士。特別是在國產手機系統中,廠商針對用戶開發了大量的功能,但很多功能的層級太深或是使用方式太複雜,往往讓用戶真正獲益。
至少在華為、OPPO、小米最新版本系統中,我們已經看到廠商通過大量的數據訓練以及系統底層接口和權限的調用,完全可以讓 AI 助手成為真正的「用機助手」,不管是對普通用戶,還是對手機不熟悉的長輩和不方便用機的障礙人群,無疑都是一件好事。
但這也只是大模型帶來的冰山一角。2024 年,所有手機廠商都需要向用戶證明,AI 融入硬件帶來的體驗升級,就像 OPPO 首席產品官劉作虎說的,大模型其實就是帶來了一個前所未有的能力,手機廠商要利用好這個能力,服務好用戶。