上周,負(fù)責(zé)維護和管理 ARC-AGI 的 Arc Prize Foundation 對 OpenAI 的 o3 “推理”人工智能模型在 ARC-AGI 基準(zhǔn)測試中的成本估算進行了重大修訂,現(xiàn)在看起來 o3 的運行成本沒有那么低。
去年 12 月 OpenAI 推出 o3 模型時,與 ARC-AGI 的開發(fā)者合作,展示了該模型在解決復(fù)雜問題上的強大能力。然而,幾個月后,其成本估算結(jié)果卻發(fā)生了顯著變化。Arc Prize Foundation 最新估計,o3 模型中表現(xiàn)最佳的配置 o3 high,解決一個單一的 ARC-AGI 問題的成本可能高達(dá)約 3 萬美元(IT之家注:現(xiàn)匯率約合 21.8 萬元人民幣),而此前的估算僅為約 3000 美元(現(xiàn)匯率約合 21821 元人民幣)。
這一成本估算的大幅上調(diào),凸顯了目前最先進 AI 模型在特定任務(wù)上可能面臨的高昂成本。盡管 OpenAI 尚未公布 o3 模型的定價,也未正式發(fā)布該模型,但 Arc Prize Foundation 認(rèn)為,OpenAI 目前最昂貴的 o1-pro 模型的定價可以作為參考。
“我們認(rèn)為 o1-pro 更接近 o3 真實成本的比較對象,因為兩者在測試時使用的計算量相近。”Arc Prize Foundation 的聯(lián)合創(chuàng)始人邁克 庫諾(Mike Knoop)在接受 TechCrunch 采訪時表示,“但這仍然只是一個參考值,我們在排行榜上仍將 o3 標(biāo)記為預(yù)覽版,以反映在官方定價公布前的不確定性。”
o3 high 的高成本并非毫無依據(jù)。據(jù) Arc Prize Foundation 介紹,o3 high 在處理 ARC-AGI 任務(wù)時,使用的計算資源是 o3 模型中計算量最低的 o3 low 配置的 172 倍。如此巨大的計算資源消耗,使得 o3 high 的成本大幅上升。
此外,有關(guān) OpenAI 計劃為面向企業(yè)客戶的高端定制服務(wù)收取高額費用的傳聞也由來已久。今年 3 月初 The Information 報道稱,該公司可能計劃每月收取高達(dá) 2 萬美元(現(xiàn)匯率約合 14.5 萬元人民幣)的費用,為企業(yè)提供像軟件開發(fā)人員代理這樣的專業(yè) AI “代理”服務(wù)。
盡管有人認(rèn)為,即使是最昂貴的 AI 模型,其成本也遠(yuǎn)低于人類承包商或員工的薪酬,但 AI 研究員托比 奧德(Toby Ord)在 X 網(wǎng)站上發(fā)表的一篇文章指出,這些模型的效率可能并不如人們預(yù)期的那么高。例如,o3 high 在 ARC-AGI 測試中,需要嘗試 1024 次才能達(dá)到最佳成績。
隨著 AI 技術(shù)的不斷發(fā)展和商業(yè)化進程的加速,如何在保持模型高性能的同時,有效控制成本,將成為行業(yè)面臨的重要挑戰(zhàn)之一。