2022年9月1日,世界人工智能大會(WAIC)“AI領(lǐng)SHOW”欄目在上海世博會議中心火熱拉開序幕!癆I領(lǐng)SHOW”是本屆WAIC整場會議活動全新升級后的配套欄目,“鎮(zhèn)館之寶”、“SAIL獎Top30代表”、“重磅新品發(fā)布”、“元宇宙”等代表紛紛閃亮登場,全程通過大會官網(wǎng)及CCTV.com直播。
中科院自動化所研究員、武漢人工智能研究院院長王金橋首先在AI領(lǐng)SHOW欄目登臺演講,展示了基于昇騰 AI 基礎(chǔ)軟硬件平臺打造的全球首個三模態(tài)大模型“紫東.太初”。“紫東.太初”通過跨模態(tài)多任務(wù)自監(jiān)督學(xué)習(xí),實現(xiàn)了圖像、文字、語音和視頻等不同模態(tài)數(shù)據(jù)之間的統(tǒng)一表示和互相生成的,且形成了完整的智能表示、推理和生成能力。
王院長在AI領(lǐng)SHOW欄目向與會嘉賓講述道:“傳統(tǒng)人工智能學(xué)習(xí)當(dāng)中,通過視覺模型可以實現(xiàn)人臉的識別,但是并不知道機器怎么表征每個人的特征差異,只能從圖像中間結(jié)果的特征圖解釋機器學(xué)習(xí)的過程,而通過“紫東.太初”三模態(tài)的模型,可以把圖像、語音等實現(xiàn)跨模態(tài)的統(tǒng)一到人類語言的維度,更接近于人類的理解和思考方式!
細數(shù)“紫東.太初”四大大突破
1.多任務(wù)多層次的跨模態(tài)自監(jiān)督學(xué)習(xí)
提出了多任務(wù)多層次的跨模態(tài)自監(jiān)督學(xué)習(xí)的訓(xùn)練框架,支持詞條級別、模態(tài)級別和樣本級別的訓(xùn)練,實現(xiàn)了跨模態(tài)理解與生成的統(tǒng)一建模。
2.首次使“以圖生音”和“以音生圖”成為現(xiàn)實
“紫東.太初”首次貫通了語音、圖像、文字這幾種信息,形成了完整的智能表示、推理和生成能力,是當(dāng)前數(shù)據(jù)智能領(lǐng)域的最新發(fā)展趨勢,為探索人類智能本質(zhì)提供了一個極佳的平臺。
3.首個千億參數(shù)多模態(tài)預(yù)訓(xùn)練大模型
“紫東.太初”作為全球范圍內(nèi)首個千億參數(shù)的三模態(tài)大模型,標(biāo)志著我國從限定領(lǐng)域的弱人工智能正式邁向通用人工智能路徑的重要探索。
4.“一專一能”突破至“多專多能”
“紫東.太初”多項算法指標(biāo)性能全球第一。讓AI從“一專一能”邁向“多專多能”的同時,在多項下游任務(wù)中超越業(yè)界最好的性能,構(gòu)建了全自主人工智能技術(shù)體系。
除了向線上線下參會嘉賓展示“紫東.太初”的技術(shù)優(yōu)勢,王院長還表示已經(jīng)實現(xiàn)基礎(chǔ)模型開源和大模型的服務(wù)開放,近期將開放“紫東.太初”服務(wù)平臺新的版本,支持低代碼人工智能模型的訓(xùn)練、微調(diào)和部署,通過API調(diào)用的模式,自動上傳數(shù)據(jù),自動標(biāo)注模型,自動形成推理部署的工具,自動體驗效果。