騰訊云AI代碼助手最新宣布,正式搭載DeepSeek-V3-0324頂級(jí)模型。
無(wú)需配置,下載/更新AI代碼助手插件即可用,官方號(hào)稱開(kāi)發(fā)效率能直接提升100倍。
DeepSeek-V3-0324是DeepSeek-V3系列的小版本迭代,模型參數(shù)從初代V3的6710億小幅增至6850億,依然采用混合專家(MoE)架構(gòu),每個(gè)token激活約370億參數(shù),在推理、編程、數(shù)學(xué)、中文處理等多個(gè)領(lǐng)域達(dá)到行業(yè)領(lǐng)先水平。
甚至最近討論火熱的“7米甘蔗過(guò)2米門(mén)”AI測(cè)試題也能自主發(fā)現(xiàn)隱藏解法,給出合理答案。
騰訊總結(jié)了DeepSeek-V3-0324的五大強(qiáng)項(xiàng):
創(chuàng)新的訓(xùn)練策略
-采用無(wú)輔助損失的負(fù)載均衡,避免傳統(tǒng)方法的性能損失
-多token預(yù)測(cè)訓(xùn)練提升推理速度,F(xiàn)P8混合精度訓(xùn)練顯著降低計(jì)算成本
-在超大規(guī)模模型上驗(yàn)證FP8訓(xùn)練的有效性,提高訓(xùn)練效率
優(yōu)化的MoE架構(gòu)
-動(dòng)態(tài)調(diào)整偏差項(xiàng),防止路由崩潰,性能提升15%以上
-節(jié)點(diǎn)受限路由機(jī)制減少跨節(jié)點(diǎn)通信流量至1/3,結(jié)合FP8調(diào)度與RDMA優(yōu)化,訓(xùn)練效率提升40%
-支持128K超長(zhǎng)上下文,可處理50頁(yè)P(yáng)DF或完整代碼庫(kù),多輪對(duì)話記憶更強(qiáng)
綜合能力大幅提升
-關(guān)鍵指標(biāo)突破性進(jìn)步,在各項(xiàng)權(quán)威基準(zhǔn)測(cè)試中相較于初代V3,在關(guān)鍵指標(biāo)上展現(xiàn)了突破性進(jìn)步。
MMLU-Pro:75.9→81.2(+5.3)-多領(lǐng)域知識(shí)理解能力
GPQA:59.1→68.4(+9.3)-專業(yè)問(wèn)答能力
AIME:39.6→59.4(+19.8)-數(shù)學(xué)競(jìng)賽解題能力,進(jìn)步最為顯著
LiveCodeBench:39.2→49.2(+10.0)-代碼生成與調(diào)試能力
-數(shù)學(xué)推理能力突出,AIME競(jìng)賽正確率提升近20%,超越Grok3
-中文處理優(yōu)勢(shì),中長(zhǎng)篇寫(xiě)作邏輯更嚴(yán)密,聯(lián)網(wǎng)搜索報(bào)告更精準(zhǔn)
頂尖的編程生成能力,代碼生成質(zhì)量達(dá)到行業(yè)頂尖水平
-單一提示詞中,可精準(zhǔn)生成800行無(wú)錯(cuò)誤網(wǎng)頁(yè)代碼(含動(dòng)態(tài)交互,視覺(jué)美觀)
-代碼可運(yùn)行率92%,支持20+編程語(yǔ)言,前端開(kāi)發(fā)效率提升80%
-在kcores-llm-arena評(píng)測(cè)超越Claude 3 Sonnet普通版
高效的推理與開(kāi)發(fā)者體驗(yàn)
-推理任務(wù)顯著提升,借鑒DeepSeek R1模型訓(xùn)練技術(shù),上線每秒20+token生成速度(M3 Ultra設(shè)備),響應(yīng)比前代快40%
-智能補(bǔ)全、代碼糾錯(cuò)、API兼容性檢測(cè)等功能大幅提升開(kāi)發(fā)效率
-支持復(fù)雜邏輯問(wèn)題(如"7米甘蔗過(guò)2米門(mén)"),自主發(fā)現(xiàn)隱藏解法