科技媒體 The Verge 昨日(1 月 7 日)發(fā)布博文,報道稱谷歌 DeepMind 正計劃組建一支專業(yè)團(tuán)隊,全力打造能夠模擬真實物理環(huán)境的“世界模型”。
該項目由前 OpenAI Sora 項目聯(lián)合負(fù)責(zé)人 Tim Brooks 領(lǐng)銜,他于今年 10 月加入 DeepMind,負(fù)責(zé)谷歌的視頻生成和世界模擬器工作,此舉被視為谷歌在通用人工智能(AGI)領(lǐng)域與競爭對手展開角逐的重要一步。
IT之家注:世界模型是 AI 中一個新興的發(fā)展方向,擁有巨大的應(yīng)用潛力。該項目通過預(yù)訓(xùn)練擴(kuò)展視頻和多模態(tài)數(shù)據(jù),并集成多模態(tài)語言模型,可用于為視頻游戲和電影創(chuàng)建實時交互式媒體環(huán)境,以及為機(jī)器人和其他 AI 系統(tǒng)創(chuàng)建逼真的訓(xùn)練場景等諸多場景,是通往通用人工智能(AGI,指機(jī)器能夠理解或?qū)W習(xí)人類能夠執(zhí)行的任何智力任務(wù))的關(guān)鍵路徑。
Brooks 在 X 平臺上公布了兩個面向研究工程師和科學(xué)家的職位空缺,旨在招募人才解決“大規(guī)模”訓(xùn)練、數(shù)據(jù)整理以及與多模態(tài)語言模型集成等關(guān)鍵問題。DeepMind 在職位描述中強(qiáng)調(diào),世界模型將為視覺推理和模擬、具體代理的規(guī)劃以及實時互動娛樂等領(lǐng)域提供支持。