谷歌宣布將旗下的 Veo 2 視頻生成 AI 模型帶給 Gemini Advanced 訂閱用戶。這一舉措旨在應(yīng)對 OpenAI 的 Sora 視頻生成平臺的競爭,并在日益激烈的市場中占據(jù)一席之地。就在兩周前,合成媒體領(lǐng)域的強勁對手 Runway 發(fā)布了其第四代視頻生成器,并成功籌集了超過 3 億美元(IT之家注:現(xiàn)匯率約合 21.93 億元人民幣)的新資金。
從本周二開始,Gemini Advanced 的用戶可以在谷歌 Gemini 應(yīng)用程序的模型下拉菜單中選擇 Veo 2。用戶能夠通過該模型創(chuàng)建 8 秒鐘、720p 分辨率、16:9 寬高比的視頻片段,并通過 Gemini 的“分享”按鈕將這些視頻上傳至 TikTok、YouTube 等平臺。此外,Veo 2 生成的視頻還可以下載為帶有谷歌 SynthID 技術(shù)水印的 MP4 文件。不過,谷歌表示,目前每月用戶可創(chuàng)建的視頻數(shù)量存在限制,且谷歌 Workspace 的商業(yè)和教育計劃暫不支持該功能。
谷歌還在其 Google Labs 的實驗性功能 Whisk 中整合了 Veo 2。Whisk 允許用戶使用圖片作為 Gemini 的提示詞來生成新圖片,而新增的 Whisk Animate 功能則可將用戶生成的圖片轉(zhuǎn)化為由 Veo 2 生成的 8 秒視頻。Google Labs 是谷歌用于展示早期階段 AI 產(chǎn)品的平臺,目前僅對每月收費 20 美元的 Google One AI Premium 訂閱用戶開放。
盡管目前 Veo 2 的應(yīng)用場景看似較為基礎(chǔ),但谷歌 DeepMind 首席執(zhí)行官德米斯 哈薩比斯(Demis Hassabis)近期表示,公司計劃最終將 Gemini AI 模型與 Veo 結(jié)合,以提升前者對物理世界的理解能力。
然而,Veo 2 等視頻生成工具的出現(xiàn)也引發(fā)了諸多藝術(shù)家和創(chuàng)作者的擔憂,這類工具可能會顛覆整個創(chuàng)意產(chǎn)業(yè)。據(jù)好萊塢動畫師和漫畫家工會(Animation Guild)委托進行的一項 2024 年研究估計,到 2026 年,AI 將擾亂美國超過 10 萬個電影、電視和動畫領(lǐng)域的就業(yè)崗位。