AI王炸？字節版MJ和Sora，實力幾何？丨AI 內測

巴比特_AI领航员229天前

文章來源：AI鯨選社

眾多周知，字節跳動在All in AI。畢竟2023年凈利潤3000億（字節否認了），要為自己準備下一階段的發展動力。

此前鯨選盤點過字節推出的很多AI 產品，大多是AI對話類。在文生圖和文生視頻領域，字節目前似乎在傾力打造Dreamina，這款AI產品對標國外的Midjourney和Sora，難度不小。

最近Dreamina在放內測資格，到底哥為你帶來一手測評。

文生圖片很多時候不僅考驗生成視頻的精細度，也考驗對文字的理解能力，我們就做一個“耳朵是蝴蝶翅膀的大象”。

從生成結果看，完全沒有體現出來文字想要表達的創意。

我們看到有上傳參考圖的功能，所以上傳了這張比較有名的創意圖。

我們選擇了主要參考點是主體，Dreamina識別出了這張圖的主體是大象。

我們在選擇寫實風格，有了參照圖后，生成的圖片終於理解了文字的意思，不過這圖片，怎麼感覺像摳圖后加上背景生成的呢？

我們先看看Dreamina社區中，一些文生視頻的案例。

是不是還挺酷炫，要知道Sora生成水杯破裂的視頻，是不能夠了解破裂過程應該如何呈現，而Dreamina這個視頻，則是理解了物理規律，還加上了想象力的翅膀。

到底哥以為文生視頻能力會很酷炫，直到我看到了它的參考圖。

我瞬間意識到，Dreamina應該和Pika等AI視頻的路線相似，就是圖片關鍵幀動起來，所以並不是對文字的真正理解，以及視頻畫面的原生，而是幾秒鐘的關鍵幀運動。

所以我們接着拿蝴蝶大象做生成測試，沒有意外，視頻也沒有體現文字的意思，還是一隻大象動了幾秒鐘。

一位同樣從事Sora產品跨國開發的負責人，告訴AI鯨選社，這是Dreamina跨域和泛化問題還沒處理好。

雖然Dreamina還存在一些問題，但其從頭研發，並且比Sora更早開放測試，證明其還是有決心和潛力做更好，期待其迭代版本。

免責聲明：本文版權歸屬原作所有，僅代表作者本人觀點，不代表YouToCoin的觀點或立場，文章內容僅供參考，不構成投資建議。投資者據此操作，風險自擔；如有關於內容、版權等問題，請與我們聯繫。