C114通信網(wǎng)  |  通信人家園

人工智能
2024/10/31 15:13

百川智能推出一站式大模型商業(yè)化解決方案,企業(yè)多元場景可用率 96%

IT之家  清源

百川大模型公眾號今日發(fā)文宣布,百川智能推出一站式大模型商業(yè)化解決方案,包含全鏈路通用訓練數(shù)據(jù),Baichuan4-Turbo、Baichuan4-Air 兩款模型和全鏈路領域增強工具鏈,可幫助企業(yè)實現(xiàn)低成本私有化部署,實現(xiàn)高達 96% 的多場景可用率。

據(jù)悉,該方案具備“工具豐富、響應快速、效果顯著、成本低廉”的特性,在 Baichuan4-Turbo、Baichuan4-Air 的基礎上,再結合超參動態(tài)搜索和自適應配比等算法,與企業(yè)私有數(shù)據(jù)混合微調,兩個模型多場景下的可用率可獲得極大提升,在金融、教育、醫(yī)療等場景下的專業(yè)細分任務的平均可用率高達 96%。

附兩個模型的主要特征如下:

Baichuan4-Turbo—— 探索復雜場景:

文本生成、知識問答、多語言處理、數(shù)據(jù)分聚類等核心能力均有顯著提升,其中信息摘要總結能力大幅提升了 50%;

只需 2 卡 4090 的算力即可完成部署;

推理成本只有 Baichuan 4 的 15%;

相較 Baichuan 4 首 Token 速度提升 51%、Token 流速提升 73%;

Baichuan4-Air—— 經(jīng)過驗證的較大規(guī)模流量的場景:

效果與 Baichuan 4 基本持平;

推理成本僅為 Baichuan 4 的 1%;

百萬 Token 只需 0.98 元;

相較 Baichuan 4 首 Token 速度提升 77%、Token 流速提升 93%;

官方更表示,在相同訓練數(shù)據(jù)下,Baichuan4-Air 不僅時效率更高,性能也大幅領先于 GPT4-style、Mixtral-style 結構的 MoE 模型。

目前,該方案能夠高效適配英偉達 4090 / A / H 系列、華為昇騰、寒武紀、高通、MTK、天數(shù)等多種主流芯片。

給作者點贊
0 VS 0
寫得不太好

免責聲明:本文僅代表作者個人觀點,與C114通信網(wǎng)無關。其原創(chuàng)性以及文中陳述文字和內容未經(jīng)本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容。

熱門文章
    最新視頻
    為您推薦

      C114簡介 | 聯(lián)系我們 | 網(wǎng)站地圖 | 手機版

      Copyright©1999-2025 c114 All Rights Reserved | 滬ICP備12002291號

      C114 通信網(wǎng) 版權所有 舉報電話:021-54451141