所有語言
分享
文章來源:AI鯨選社
眾多周知,字節跳動在All in AI。畢竟2023年凈利潤3000億(字節否認了),要為自己準備下一階段的發展動力。
此前鯨選盤點過字節推出的很多AI 產品,大多是AI對話類。在文生圖和文生視頻領域,字節目前似乎在傾力打造Dreamina,這款AI產品對標國外的Midjourney和Sora,難度不小。
最近Dreamina在放內測資格,到底哥為你帶來一手測評。
文生圖片很多時候不僅考驗生成視頻的精細度,也考驗對文字的理解能力,我們就做一個“耳朵是蝴蝶翅膀的大象”。
從生成結果看,完全沒有體現出來文字想要表達的創意。
我們看到有上傳參考圖的功能,所以上傳了這張比較有名的創意圖。
我們選擇了主要參考點是主體,Dreamina識別出了這張圖的主體是大象。
我們在選擇寫實風格,有了參照圖后,生成的圖片終於理解了文字的意思, 不過這圖片,怎麼感覺像摳圖后加上背景生成的呢?
我們先看看Dreamina社區中,一些文生視頻的案例。
是不是還挺酷炫,要知道Sora生成水杯破裂的視頻,是不能夠了解破裂過程應該如何呈現,而Dreamina這個視頻,則是理解了物理規律,還加上了想象力的翅膀。
到底哥以為文生視頻能力會很酷炫,直到我看到了它的參考圖。
我瞬間意識到,Dreamina應該和Pika等AI視頻的路線相似,就是圖片關鍵幀動起來,所以並不是對文字的真正理解,以及視頻畫面的原生,而是幾秒鐘的關鍵幀運動。
所以我們接着拿蝴蝶大象做生成測試,沒有意外,視頻也沒有體現文字的意思,還是一隻大象動了幾秒鐘。
一位同樣從事Sora產品跨國開發的負責人,告訴AI鯨選社,這是Dreamina跨域和泛化問題還沒處理好。
雖然Dreamina還存在一些問題,但其從頭研發,並且比Sora更早開放測試,證明其還是有決心和潛力做更好,期待其迭代版本。