日前,DeepSeek宣布DeepSeek V3模型完成小版本升級(jí),版本號(hào)為DeepSeek-V3-0324。
27日晚,摩爾線程宣布,其迅速響應(yīng)并完成了對(duì)DeepSeek-V3的無縫升級(jí),實(shí)現(xiàn)了零報(bào)錯(cuò)、零兼容性問題的光速部署。
摩爾線程表示,在Deepseek-V3-0324模型上的光速適配,再次有力驗(yàn)證了國(guó)產(chǎn)全功能GPU在推動(dòng)大模型產(chǎn)業(yè)化落地方面的巨大潛力。
據(jù)了解,DeepSeek-V3-0324模型參數(shù)從初代V3的6710億小幅增至6850億,依然采用混合專家(MoE)架構(gòu),每個(gè)token激活約370億參數(shù),在推理、編程、數(shù)學(xué)、中文處理等多個(gè)領(lǐng)域達(dá)到行業(yè)領(lǐng)先水平。
根據(jù)DeepSeek官方發(fā)布的測(cè)試報(bào)告,DeepSeek-V3-0324在各項(xiàng)能力評(píng)測(cè)中表現(xiàn)出色。
DeepSeek-V3-0324不僅全面超越Claude-3.7-Sonnet與Qwen-Max等同類型優(yōu)質(zhì)模型,更在數(shù)學(xué)、代碼類等相關(guān)評(píng)測(cè)集上勝過了GPT-4.5。