12月18日上午消息,今日舉辦的火山引擎 Force 大會(huì)上,字節(jié)跳動(dòng)正式發(fā)布發(fā)布豆包視覺(jué)理解模型,為企業(yè)提供極具性價(jià)比的多模態(tài)大模型能力。豆包視覺(jué)理解模型千tokens輸入價(jià)格僅為3厘,一元錢(qián)就可處理284張720P的圖片,比行業(yè)價(jià)格便宜85%,以更低成本推動(dòng)AI技術(shù)普惠和應(yīng)用發(fā)展。
據(jù)火山引擎總裁譚待介紹,豆包視覺(jué)理解模型不僅能精準(zhǔn)識(shí)別視覺(jué)內(nèi)容,還具備出色的理解和推理能力,可根據(jù)圖像信息進(jìn)行復(fù)雜的邏輯計(jì)算,完成分析圖表、處理代碼、解答學(xué)科問(wèn)題等任務(wù)。此外,該模型有著細(xì)膩的視覺(jué)描述和創(chuàng)作能力。
豆包3D生成模型也首次亮相。該模型與火山引擎數(shù)字孿生平臺(tái)veOmniverse結(jié)合使用,可以高效完成智能訓(xùn)練、數(shù)據(jù)合成和數(shù)字資產(chǎn)制作,成為一套支持AIGC創(chuàng)作的物理世界仿真模擬器。