所有語言
分享
原文來源:雷科技
圖片來源:由無界 AI生成
過去幾年,不管是在硬件、軟件還是互聯網行業,創新乏力都是一個普遍的印象。
這當然不是說就沒有創新了,但必須承認的是,智能手機和移動互聯網已經發展了這麼多年,產品和服務形態大多成熟,各個生態位也基本都擠滿了巨頭和中小公司,只有少數創業公司和新應用還能在行業、市場的邊緣給出讓人眼前一亮的創新。
但 2023——過去這一年的與眾不同之處在於,生成式 AI 的浪潮來了。從去年年底推出的 ChatGPT 開始,這一輪的人工智能浪潮不僅席捲了科技行業自身,也讓各國政府、不同行業以及普羅大眾都捲入到這場浪潮之中。
由此,全球範圍都掀起了一輪新的 AI 創業潮,以及各種 AI 原生應用的爆發,除了 ChatGPT、Claude、谷歌 Bard 和百度文心一言等聊天機器人,我們還能看到從 Perplexity AI 原生搜索引擎到妙鴨相機,再到 HeyGen 和 Pika。
回望 2023 年,我們不應該錯過它們。
圖/ App Store
通過上傳約 20 張照片,就能製作自己的数字分身,並生成專業質感的寫真照片,妙鴨相機從發布開始就表現出了與一眾互聯網大廠生成式 AI 產品的不同,儘管這是由優酷旗下團隊打造的一款產品。
不僅如此,妙鴨相機也沒有選擇面向 C 端用戶「免費」的模式,而是設置了 9.9 元的付費門檻。但即便如此,妙鴨相機依舊憑藉更高效、獨特的體驗以及極高的「出片率」成為了大量年輕人的新寵,連帶服務器也經常被擠爆。對此,雷科技在《在爆火的妙鴨相機上,我看到了 AI 應用的「流量密碼」》一文也有更深入的體驗和看法。
儘管妙鴨相機的「爆火」來得快、去得也快,但毫無疑問,妙鴨相機給了不少生成式 AI 應用一些啟示和反思。
圖/ Perplexity
作為一款新生的 AI 對話搜索引擎,Perplexity 其實最早在 2022 年 12 月就發布了,開始是採用 OpenAI 的 GPT-3 大模型作為「動力」,後面隨着 ChatGPT 在全球範圍的爆火,也將模型升級到了 GPT-3.5 和 GPT-4(付費專享)。此外,Perplexity 在 2023 年做了大量產品層面和模型應用層面的探索和升級,這也是為什麼在這篇文章中將其歸為「2023 年 AI 新應用」的原因。
事實上,經過過去這一年的多次迭代,Perplexity 和雷科技最初關注到它的時候已經有了很大的不同(文章可見《ChatGPT 成為“X 因素”,百度再度掀起搜索大戰?》),不僅外觀、功能大變樣,整個產品形態也更加成熟、好用。同時,在提供 GPT-3.5/4、Claude2、Llama 2、Gemini Pro 等主流模型之外,Perplexity 其實也在持續更新自主訓練的大模型。
而在 2023 年 10 月最新一輪的融資中,Perplexity 的估值也來到了 5 億美元。
圖/Chirper
毋庸置疑,社交領域一直都是每一次技術革命的焦點之一,比如 Web 2.0 后出現的一大堆社交平台,在移動互聯網后又有大量新興社交平台的出現。從這個角度來看,Chirper 至少代表了硅基智能時代的一種嘗試。
Chirper 是一個專門為 AI 設計的社交平台,不過僅限 AI 發布內容,人類禁止發言,相當於是一個 AI 們的新浪微博。儘管人類無法發言、只能看着 AI 聊天機器人在其中發布動態、評論、分享、互動,但還是可以自己「捏人」——設置 AI 聊天機器人的名字、性格、興趣、語言風格等來參与到社區之中。就連馬斯克、Sam Altman(OpenAI CEO)等也被一度吸引至此。
而 Chirper 的「捏人」過程,實際相當於一個固定的提示詞前綴,AI 看到其他內容,是提示詞的主體。所以當前綴和主體被傳到大模型進行推理輸出后,就有了 AI 的發帖內容和回復。
圖/ HeyGen
就在去年 11 月左右,網上突然開始流行一些視頻,比如歌手 Taylor Swift 操着一口流利普通話,視頻卡點之準確,音色之相似,甚至是口型都完全能對上,騙得不少直呼「卧槽」。不僅如此,我們還能看到說著一口地道中文的特朗普、憨豆先生以及說著英語的蔡明。
而這些視頻都用了同一款 AI 視頻工具——HeyGen。HeyGen 是國內的一家創新企業(詩云科技)旗下的產品,他們希望通過開發一款視覺引擎,將視頻製作從傳統的基於拍攝的方式轉變為 AI 生成的形式。
不過 Heygen 能做的其實不止 AI 跨語言配音。應該說,Heygen 是一個功能全面、效果很好的 AI 虛擬人應用,以 AI Avatar(虛擬人形象)和 Voice Clone(聲音克隆)兩大技術作為基礎,可以適用於虛擬主播、一鍵換衣等各種場景。
圖/ Pika
不同於 HeyGen 剛開始就定位於商業工具,最新火出圈的 Pika 代表了一種 AI 視頻生成公司,儘管距離技術成熟還有一段明顯的距離,但在人機協同創作的背後,擁有無限的可能。而 Pika,也是目前這一賽道最驚艷的初創項目。
雖然前有 Runway 宣布升級 Gen-2,帶來了更長的生成視頻長度,但就視頻生成質量而言,Pika 的生成質量遠高於 Gen-2。文本生成視頻最大的問題在於動畫生成的清晰和連貫性,Gen-2 只能在微小動作上保證視頻的穩定性,一旦動作幅度加大就會產生不同程度的變形,但 Pika 目前就展示出了非常連貫的動畫效果。
此外,Pika 的兩位女性華人創始人也引起了大量的關注,但實際上很多人並不知道,Pika 的投資人可以說齊聚了 AI 圈的半壁江山,包括 OpenAI 創始成員 Karpathy、前 Github CEO Nat Friedman、Quora 創始人 Adam D'Angelo、Perplexity CEO 等,由此可見 Pika 得到的認可。
第一期節目封面,圖/ podcast.ai
作為一種內容形式,這幾年播客早就成為了全球範圍的新趨勢,包括 Spotify、Youtube Music、QQ 音樂等音樂平台都陸續內置了播客功能。但在 2023 年 10 月,一檔完全由 AI 生成的播客節目 podcast.ai 登場,第一期就是採訪 AI 生成的蘋果公司創始人史蒂夫·喬布斯。
podcast.ai 通過喬布斯的傳記和收集網絡上關於他的所有錄音,用 Play.ht 的語言模型大量訓練,最終生成了假 Joe Rogan 採訪喬布斯的播客內容。Play.ht 認為,未來所有內容創作都將由人工智能生成,但由人類指導,「最具創造性的工作將取決於人類將他們想要的創作表達到模型中的能力。」
2023 年,我們見證了生成式 AI 技術在多個領域的突破和創新,從音樂製作到動畫,再到播客製作,AI 不僅展現了其技術的成熟度,也揭示了未來可能的發展方向。
隨着技術的不斷進步,我們也期待 AI 將在未來的各個領域中扮演更加重要的角色。而我相信,在未來的一年以及更長的時間緯度下,不斷湧現出的 AI 新應用在將新技術擴散到更廣泛的用戶群體,也將改變大多數人的生活。