通過(guò)跟蹤Meta、OpenAl、谷歌、Anthropic、百度、微軟、英偉達(dá)、亞馬遜、蘋果、騰訊、阿里、華為、字節(jié)跳動(dòng)等在國(guó)內(nèi)外AI產(chǎn)業(yè)格局中有著舉足輕重的地位的頭部企業(yè),對(duì)上述公司在大模型領(lǐng)域的技術(shù)和業(yè)務(wù)布局進(jìn)行梳理跟蹤分析,建議電信運(yùn)營(yíng)商加快大模型戰(zhàn)略方向調(diào)整,加快布局新的市場(chǎng)機(jī)遇。
技術(shù)布局:原生多模態(tài)、MOE與COE、數(shù)據(jù)合成等新技術(shù)牽引大模型技術(shù)發(fā)展方向
1.端到端原生多模態(tài)技術(shù)大幅提升交互體驗(yàn)
2024年,谷歌、Meta、OpenAI等企業(yè)接連開(kāi)始應(yīng)用并且發(fā)布各自版本的端到端原生多模態(tài)大語(yǔ)言模型,如Gemini、GPT-4o、ImageBind等,智源研究院也發(fā)布原生多模態(tài)世界模型Emu3。這些機(jī)構(gòu)采用的原生多模態(tài)技術(shù)相比傳統(tǒng)多模態(tài)技術(shù),存在明顯優(yōu)勢(shì)。一是多模態(tài)信息集成能力。原生多模態(tài)技術(shù)可將多模態(tài)信息集成到一個(gè)大模型中,統(tǒng)一數(shù)據(jù)輸入模式,使用統(tǒng)一模型來(lái)同時(shí)處理文本、視覺(jué)和音頻信息,輸入輸出都由同一個(gè)神經(jīng)網(wǎng)絡(luò)完成,跨模態(tài)處理時(shí)不會(huì)像傳統(tǒng)技術(shù)大量丟失有效信息,從而有效提高模型準(zhǔn)確率。二是復(fù)雜環(huán)境時(shí)間線理解能力。原生多模態(tài)技術(shù)可將多模態(tài)信息組合成事件時(shí)間線,實(shí)現(xiàn)對(duì)周圍環(huán)境的記憶和理解。如Project Astra、ImageBind等可適用于構(gòu)建全方位、多層次的復(fù)雜場(chǎng)景數(shù)據(jù)分析和內(nèi)容生成系統(tǒng)。
根據(jù)多家企業(yè)實(shí)踐發(fā)現(xiàn),端到端原生多模態(tài)技術(shù)較傳統(tǒng)多模態(tài)技術(shù)明顯躍升的根源是,多模態(tài)的預(yù)訓(xùn)練數(shù)據(jù)融合對(duì)齊并與大模型框架的耦合性得到了革命性的提升。如Gemini模型對(duì)圖像、視頻、文本等不同模態(tài)數(shù)據(jù)采用特定嵌入方法,將其轉(zhuǎn)化為統(tǒng)一嵌入向量后再進(jìn)行多模態(tài)融合學(xué)習(xí)及訓(xùn)練,統(tǒng)一采用Transformer Decoder結(jié)構(gòu)并通過(guò)高效的多查詢注意力機(jī)制、超長(zhǎng)上下文窗口容量等技術(shù)優(yōu)化及MoE架構(gòu),優(yōu)化了推理穩(wěn)定性及效率。OpenAI提出的基于擴(kuò)散模型改進(jìn)的連續(xù)時(shí)間一致性模型,生成速度是擴(kuò)散模型的50倍,為實(shí)時(shí)生成圖像、音頻和視頻等多模態(tài)信息提供可能。
2.MOE與COE技術(shù)大幅提升模型訓(xùn)練效率
2024年,大模型應(yīng)用場(chǎng)景不斷地變得復(fù)雜化和專業(yè)化、碎片化,受到大模型商業(yè)化的不可能三角定律(運(yùn)算成本、響應(yīng)速度和模型能力)限制,繼續(xù)推高萬(wàn)億參數(shù)規(guī)模大模型使其同時(shí)具備通用能力和專業(yè)領(lǐng)域能力,已經(jīng)喪失可能。多模型聯(lián)合分工成為頭部企業(yè)共識(shí)。
當(dāng)前階段多家企業(yè)多模型聯(lián)合作業(yè)的主流架構(gòu)方案主要有MoE(混合專家)與CoE(專家協(xié)同)兩種。其中MoE架構(gòu)由門控網(wǎng)絡(luò)(Gating Network)與多個(gè)專家(Experts)模型組成,核心是門控網(wǎng)絡(luò),是一個(gè)選擇機(jī)制,決定哪些專家應(yīng)該處理輸入數(shù)據(jù)。門控網(wǎng)絡(luò)根據(jù)輸入數(shù)據(jù)生成一組權(quán)重,這些權(quán)重用于加權(quán)組合各個(gè)專家的輸出。每個(gè)輸入數(shù)據(jù)會(huì)選擇和激活其中的一部分專家模型來(lái)進(jìn)行處理,從而減少計(jì)算量,提高訓(xùn)練和推理速度,適合處理大規(guī)模和復(fù)雜的數(shù)據(jù)集。。如Google采用MoE架構(gòu)的Switch Transformers模型與傳統(tǒng)稠密模型相比,預(yù)訓(xùn)練速度和模型速度分別提高了7倍和4倍。CoE架構(gòu)由獨(dú)立和異構(gòu)的專家模型組成,不同于MoE仍需要將總體作為單個(gè)模型進(jìn)行訓(xùn)練/微調(diào),CoE架構(gòu)下的模型彼此獨(dú)立訓(xùn)練/微調(diào),其核心是構(gòu)建專家路由,路由器負(fù)責(zé)了解哪個(gè)專家最適合特定查詢并將請(qǐng)求路由到該專家模型,每個(gè)專家解決一個(gè)問(wèn)題序列,實(shí)現(xiàn)推理資源優(yōu)化,較MoE架構(gòu)擁有更好魯棒性、更高效率、更強(qiáng)泛化能力和可解釋性,更適用于分布式實(shí)時(shí)深度學(xué)習(xí)任務(wù)或具有高度專業(yè)化需求的場(chǎng)景。如360公司使用“草莓架構(gòu)(CoE)”實(shí)現(xiàn)思維鏈+多系統(tǒng)協(xié)同,集合10多家國(guó)內(nèi)主流大模型廠商的大模型和專家模型,其測(cè)評(píng)結(jié)果顯示在 11 個(gè)單項(xiàng)能力測(cè)試指標(biāo)上超越 GPT-4o。未來(lái)多模型協(xié)同時(shí)代,更多企業(yè)將會(huì)使用CoE架構(gòu)。
3.數(shù)據(jù)合成技術(shù)有效緩解自然數(shù)據(jù)增長(zhǎng)瓶頸
多家研究機(jī)構(gòu)指出,2028年之前,大模型將消耗盡人類積累的所有高質(zhì)量數(shù)據(jù),由于需要人工高質(zhì)量反饋,獲取成本將越來(lái)越高,且一些如罕見(jiàn)病、極端天氣等真實(shí)世界中難以觀測(cè)的數(shù)據(jù),未來(lái)將難以快速獲取。目前英偉達(dá)、微軟、華為、騰訊、阿里等企業(yè)在數(shù)據(jù)合成領(lǐng)域的實(shí)踐凸顯了該技術(shù)的巨大市場(chǎng)價(jià)值。數(shù)據(jù)合成不僅可以顯著提升數(shù)據(jù)精度和數(shù)據(jù)相關(guān)性,還可以解決自然數(shù)據(jù)增長(zhǎng)不足帶來(lái)的數(shù)據(jù)稀缺問(wèn)題和數(shù)據(jù)合規(guī)問(wèn)題,極大降低人工智能算法對(duì)數(shù)據(jù)的依賴性。2024年,合成數(shù)據(jù)技術(shù)的發(fā)展得益于生成對(duì)抗網(wǎng)絡(luò)(GAN)、變分自編碼器(VAE)、擴(kuò)散模型(Diffusion Model)等AI算法的進(jìn)步,使得合成數(shù)據(jù)質(zhì)量不斷提升。
合成數(shù)據(jù)技術(shù)路線眾多,可分成兩大類,一是基于真實(shí)數(shù)據(jù)集,模型捕獲真實(shí)數(shù)據(jù)的分布特性和結(jié)構(gòu)特征,刻畫數(shù)據(jù)中的多變量關(guān)系和相互作用進(jìn)行生成構(gòu)建;二是純模擬生成,如文生視頻模型使用 Unity、Unreal Engine等游戲引擎合成的視頻。常用的方案有以下三種:基于LLMs生成的合成數(shù)據(jù)、基于GANs或者DiffusionModels生成的合成數(shù)據(jù)、基于統(tǒng)計(jì)和模擬生成的合成數(shù)據(jù),在實(shí)際應(yīng)用中多種方式往往相互協(xié)同和補(bǔ)充,以提升數(shù)據(jù)合成質(zhì)量。
英偉達(dá)和華為均在汽車自動(dòng)駕駛領(lǐng)域使用合成數(shù)據(jù)。其中,英偉達(dá)向用戶開(kāi)放Omniverse平臺(tái)自主生成自動(dòng)駕駛合成數(shù)據(jù)。華為采用弱模型輔助強(qiáng)模型(weak2strong)方法,迭代式合成不輸于真實(shí)數(shù)據(jù)的完整性、相關(guān)性和知識(shí)性等指標(biāo)的數(shù)據(jù),提升長(zhǎng)序列測(cè)試約20%的表現(xiàn),其盤古5.0大模型訓(xùn)練數(shù)據(jù)中30%是合成數(shù)據(jù)。6月,英偉達(dá)發(fā)布新一代開(kāi)源大模型Nemotron-4340B,其指令模型訓(xùn)練是在98%合成數(shù)據(jù)基礎(chǔ)上完成,此前英偉達(dá)還推出了合成數(shù)據(jù)生成工具OmniverseReplicator,能夠生成物理模擬的合成數(shù)據(jù),用于自動(dòng)駕駛汽車和機(jī)器人的訓(xùn)練。7月,蘋果也發(fā)布了其自研的人工智能系統(tǒng)AppleIntelligence,在預(yù)訓(xùn)練階段也大量使用了合成數(shù)據(jù)。
產(chǎn)品布局:全;⒍藗(cè)化和工具化三條路徑加速產(chǎn)品創(chuàng)新和商業(yè)化落地
全;季职凑斩鄺l主線展開(kāi)。對(duì)標(biāo)企業(yè)沿著AI芯片和算力設(shè)施、云平臺(tái)、大模型、端側(cè)AI設(shè)備及應(yīng)用入口等產(chǎn)業(yè)環(huán)節(jié),采取多種方式將企業(yè)前端產(chǎn)品和后端技術(shù)能力進(jìn)行整合。一是以增強(qiáng)政企客戶方案為主線,通過(guò)AI重構(gòu)產(chǎn)品鏈提供一站式服務(wù)。如華為公司通過(guò)AI重新定義數(shù)據(jù)治理方法、自研異構(gòu)芯片匹配復(fù)多種算力需求、打造基于混合云部署的大模型能力平臺(tái),通過(guò)多云協(xié)同架構(gòu)、軟硬協(xié)同優(yōu)化形成完整的AI方案鏈,在政務(wù)等領(lǐng)域占據(jù)絕對(duì)份額。二是以多層級(jí)大模型協(xié)同為主線,實(shí)現(xiàn)從基座-通用/專用-端側(cè)大模型的端到端優(yōu)化。如多家企業(yè)均構(gòu)建了“基座+通用+專業(yè)+端側(cè)”的四級(jí)模型體系,通過(guò)基座模型、多模態(tài)等通用大模型能夠迅速搭建行業(yè)和場(chǎng)景等任務(wù)大模型,同時(shí)任務(wù)大模型負(fù)責(zé)收集真實(shí)應(yīng)用場(chǎng)景與數(shù)據(jù)反哺基座大模型的能力泛化和性能優(yōu)化,提升特定行業(yè)應(yīng)用效果。三是以企業(yè)AI軟硬件一體化能力提升為主線,實(shí)現(xiàn)體系化創(chuàng)新。如百度公司通過(guò)全棧自研AI基礎(chǔ)能力,實(shí)現(xiàn)AI基礎(chǔ)層、技術(shù)層和應(yīng)用層的高度耦合,打造從芯片到行業(yè)方案、具身智能設(shè)備的“云智一體”商業(yè)閉環(huán)路徑,實(shí)現(xiàn)體系化創(chuàng)新,2024年在國(guó)內(nèi)AI市場(chǎng)競(jìng)爭(zhēng)力和盈利能力均顯著提升。
端側(cè)化應(yīng)用實(shí)踐快速發(fā)展。對(duì)標(biāo)企業(yè)的端側(cè)大模型部署終端已經(jīng)從AI PC和智能手機(jī)蔓延到智能汽車、具身機(jī)器人和掃地機(jī)等邊緣智能設(shè)備,應(yīng)用場(chǎng)景也從個(gè)人AI助理擴(kuò)展到智能駕駛等個(gè)人服務(wù)領(lǐng)域和金融服務(wù)等專業(yè)服務(wù)領(lǐng)域,即將形成新的藍(lán)海市場(chǎng)。如騰訊公司在深圳等療養(yǎng)機(jī)構(gòu)內(nèi)測(cè)推出的輪足類機(jī)器人“小五”備受好評(píng),潛在市場(chǎng)規(guī)模接近千億。對(duì)標(biāo)企業(yè)多重實(shí)踐推動(dòng)端側(cè)市場(chǎng)快速發(fā)展。一是端云協(xié)同實(shí)踐走向成熟,便于打開(kāi)市場(chǎng)。“端云協(xié)同”成為大模型落地機(jī)器人等終端的創(chuàng)新范式,端側(cè)大模型距離用戶更近,采用安全高效方式理解用戶意圖、快速響應(yīng),云側(cè)大模型用于滿足用戶深層次需求,兩者各有優(yōu)勢(shì),通過(guò)云側(cè)計(jì)算、存儲(chǔ)能力與端側(cè)深度協(xié)同,可以克服端側(cè)算力性能瓶頸和硬件成本問(wèn)題,帶動(dòng)市場(chǎng)需求。二是行業(yè)開(kāi)始自發(fā)形成終端智能化分級(jí)。目前,市場(chǎng)自發(fā)形成從L1智能響應(yīng)級(jí)-L2智能輔助級(jí)-L3智能助理級(jí)-L4智能協(xié)同級(jí)-L5自主智能級(jí)的分級(jí)標(biāo)準(zhǔn),端側(cè)大模型的性能提升迅速推動(dòng)端側(cè)設(shè)備提升到L3層級(jí),如Anthropic的Claude 3.5 Sonnet版已經(jīng)實(shí)現(xiàn)“computer use”功能。三是AI OS和AI as System等設(shè)計(jì)為端側(cè)智能提升提供平臺(tái)。蘋果等公司打造的AI OS和AI as System為端側(cè)設(shè)備智能水平提升提供創(chuàng)新平臺(tái),帶動(dòng)端側(cè)設(shè)備智能水平升級(jí)。如蘋果Apple Intelligence采用直接打造AI OS方式打通多款移動(dòng)APP應(yīng)用,另外還有企業(yè)采取AI即系統(tǒng)(AI as System)方式,將MoE(混合專家模型)直接落地在手機(jī)端側(cè)。
工具化成為新型業(yè)務(wù)增收來(lái)源。全球市場(chǎng)高度重視大模型應(yīng)用落地與生態(tài)的態(tài)勢(shì),推動(dòng)對(duì)標(biāo)企業(yè)將大模型應(yīng)用開(kāi)發(fā)工具產(chǎn)品或平臺(tái)分離出來(lái),從自有大模型服務(wù)衍生拓入AI原生工具賽道,作為單獨(dú)的服務(wù)選項(xiàng)進(jìn)行銷售。云商對(duì)外輸出一站式AI原生能力工具服務(wù)。云服務(wù)商通過(guò)云平臺(tái)輸出AI原生能力,提供低門檻開(kāi)發(fā)、模型可共享、應(yīng)用易適配的外包服務(wù),大幅降低企業(yè)開(kāi)發(fā)和應(yīng)用大模型的門檻,體現(xiàn)商業(yè)價(jià)值。如阿里云百煉平臺(tái)提供一站式大模型開(kāi)發(fā)及應(yīng)用構(gòu)建服務(wù),騰訊云通過(guò)TRTC提供音視頻采集、處理、傳輸?shù)皆贫薃I處理一站式全鏈路能力,百度云則通過(guò)文心大模型API,推動(dòng)AI原生應(yīng)用開(kāi)發(fā)。初創(chuàng)公司對(duì)外提供智能體等AI 代碼生成服務(wù)。初創(chuàng)企業(yè)抓住大模型技術(shù)帶來(lái)的軟件研發(fā)市場(chǎng)機(jī)遇,推出易用多種AI編程工具包服務(wù),如OpenAI推出 Agent Builder 用于創(chuàng)建和定制 AI Agent,Anthropic推出可輔助數(shù)據(jù)分析編程的 JavaScript 沙盒工具,微軟推出可通過(guò)自然語(yǔ)言描述完成應(yīng)用開(kāi)發(fā)的 Github Spark 。算力服務(wù)商主要提供企業(yè)定制化工具包服務(wù)。以華為、英偉達(dá)等代表的算力服務(wù)商重點(diǎn)聚焦全球500強(qiáng)和重點(diǎn)傳統(tǒng)行業(yè),提供多類組合的定制化工具包,如華為提供應(yīng)用開(kāi)發(fā)框架、Prompt工程等應(yīng)用開(kāi)發(fā)套件和模型定制工作流等模型開(kāi)發(fā)套件、AI數(shù)據(jù)湖等數(shù)據(jù)工程套件,供不同情況的客戶選擇使用,英偉達(dá)則提供3D圖形渲染的行業(yè)多模態(tài)大模型算力套件、DGX Cloud超算加速庫(kù)套件等定制化工具包。
對(duì)電信運(yùn)營(yíng)商AI業(yè)務(wù)的發(fā)展建議
目前電信運(yùn)營(yíng)商大模型開(kāi)發(fā)和應(yīng)用實(shí)踐與對(duì)標(biāo)企業(yè)相比存在一定的偏離,值得我們認(rèn)真思考。一方面大模型綜合性能難以縮短與世界一流模型的差距,繼續(xù)往AGI方向大量投資是否有意義。另一方面,與對(duì)標(biāo)企業(yè)實(shí)踐相比,電信運(yùn)營(yíng)商在大模型商業(yè)化方面的實(shí)踐仍遠(yuǎn)遠(yuǎn)不夠,目前僅在部分重點(diǎn)領(lǐng)域開(kāi)展應(yīng)用。
建議電信運(yùn)營(yíng)商加快大模型戰(zhàn)略方向調(diào)整,加快原生多模態(tài)相關(guān)技術(shù)研發(fā),加強(qiáng)加強(qiáng)從技術(shù)到產(chǎn)品的轉(zhuǎn)化,豐富大模型產(chǎn)品體系。
1.加快大模型戰(zhàn)略方向調(diào)整,加快布局新的市場(chǎng)機(jī)遇
緊隨大模型應(yīng)用生態(tài)市場(chǎng)規(guī)模逐步趕超云和芯片的市場(chǎng)發(fā)展機(jī)遇,加快推動(dòng)電信運(yùn)營(yíng)商大模型布局向商業(yè)閉環(huán)方向調(diào)整。首先,借鑒對(duì)標(biāo)AI重構(gòu)企業(yè)核心業(yè)務(wù)實(shí)踐,加快將大模型集成到現(xiàn)有戰(zhàn)新產(chǎn)品和云網(wǎng)服務(wù)中,增加用戶粘性并帶動(dòng)營(yíng)收增長(zhǎng)。其次,加快轉(zhuǎn)變以行業(yè)以云服務(wù)商角色而非專業(yè)初創(chuàng)公司角色提供大模型服務(wù),充分發(fā)揮企業(yè)云平臺(tái)和大模型服務(wù)的聯(lián)合優(yōu)勢(shì)。最后,高度重視2H/2C 領(lǐng)域端側(cè)AI手機(jī)和其他端側(cè)設(shè)備的規(guī)模應(yīng)用市場(chǎng)機(jī)遇,占據(jù)市場(chǎng)入口。
2.加強(qiáng)原生多模態(tài)、數(shù)據(jù)合成等相關(guān)技術(shù)研發(fā),整體提升技術(shù)鏈水平
一是在算法和架構(gòu)層面,推進(jìn)原生多模態(tài)發(fā)展,首先突破多模態(tài)數(shù)據(jù)(離散的文本數(shù)據(jù)、連續(xù)的語(yǔ)音、圖像數(shù)據(jù)等)的統(tǒng)一建模、表示和學(xué)習(xí)。其次研發(fā)更好支持原生多模態(tài)的統(tǒng)一模型,如自回歸模型(多模態(tài)理解)與擴(kuò)散模型(視覺(jué)生成)的融合。
二是加快開(kāi)發(fā)適用的COE等架構(gòu)提升平臺(tái)聚合第三方大模型的能力。借鑒頭部企業(yè)聚合多種能力大模型的基本框架和技術(shù)方案,加快打造適用于電信運(yùn)營(yíng)商大模型實(shí)踐的專家模型架構(gòu)。一種思路是借鑒OpenAl o1,將星辰大模型分開(kāi)兩個(gè)系列分別打造“快慢雙系統(tǒng)思維架構(gòu)(Dual Process)”,其中類GPT系列大模型負(fù)責(zé)類似于人類直覺(jué)思維的“快思考”,適用于簡(jiǎn)單重復(fù)的AI場(chǎng)景,類o系列大模型負(fù)責(zé)類似于人類邏輯思維的“慢思考”,適用于復(fù)雜推理的AI場(chǎng)景,兩個(gè)系列大模型通過(guò)思維鏈協(xié)同運(yùn)作方式融合成為完整的星辰大模型系統(tǒng)。另一種思路是借鑒多家企業(yè)采用的CoE架構(gòu),集合數(shù)量眾多的內(nèi)外部大模型和第三方大模型,其中星辰大模型負(fù)責(zé)意圖識(shí)別模型和任務(wù)分解調(diào)度模型,來(lái)實(shí)現(xiàn)對(duì)客戶意圖精準(zhǔn)理解及敏捷調(diào)度適用的大模型和算力資源;外部和第三方大模型負(fù)責(zé)各自行業(yè)語(yǔ)料的積累與行業(yè)算法,最終在電信運(yùn)營(yíng)商平臺(tái)上實(shí)現(xiàn)聚合眾多行業(yè)大模型和客戶,積累規(guī)模知識(shí)中樞和大量AI工具。
3.加強(qiáng)從技術(shù)到產(chǎn)品的轉(zhuǎn)化,豐富大模型產(chǎn)品體系
一是加快融合面向政企客戶的“混合云+傳統(tǒng)AI+GenAI”產(chǎn)品和能力。首先,跟隨大模型API銷售價(jià)格不斷下降帶來(lái)的加快“云+AI”部署方式的趨勢(shì),統(tǒng)籌考慮政企客戶仍然存在傳統(tǒng) NLP/CV 模型和大小模型混用等復(fù)雜需求,從算力調(diào)度到云平臺(tái)能力全面適配,打造高性價(jià)比、高吻合度的AI解決方案。其次,設(shè)計(jì)大模型混合云架構(gòu),允許用戶將大模型從本地延伸到邊緣和公有云,提升模型訓(xùn)練性能、數(shù)據(jù)清洗、模型開(kāi)發(fā)和應(yīng)用開(kāi)發(fā)效率。最后,聚焦技術(shù)與場(chǎng)景的深度融合,能夠全面支持企業(yè)級(jí) RAG 和企業(yè)級(jí) Agent、企業(yè)專屬小模型等多種需求,推動(dòng)大模型在行業(yè)中的落地應(yīng)用。
二是加快原生多模態(tài)能力在“5G+”領(lǐng)域的應(yīng)用。首先,全面提升電信運(yùn)營(yíng)商在重點(diǎn)領(lǐng)域的數(shù)據(jù)增強(qiáng)、多模態(tài)數(shù)據(jù)合成和數(shù)據(jù)標(biāo)注等能力,全面推進(jìn)數(shù)據(jù)能力工具化。通過(guò)模擬器生成的多模態(tài)場(chǎng)景數(shù)據(jù)可廣泛應(yīng)用于5G+工業(yè)機(jī)器人等領(lǐng)域,建議重點(diǎn)加強(qiáng)在5G+和低空經(jīng)濟(jì)領(lǐng)域的多模態(tài)數(shù)據(jù)集合成,開(kāi)發(fā)基于LLM解釋器模塊、可提示視覺(jué)模塊以及3D時(shí)空融合和自動(dòng)標(biāo)注的新型數(shù)據(jù)標(biāo)注系統(tǒng),加快為5G+AI賦能重點(diǎn)行業(yè)和重點(diǎn)領(lǐng)域疊加多模態(tài)大模型能力。其次,加快成熟場(chǎng)景的原生多模態(tài)產(chǎn)品研發(fā)和推廣,特別是電信運(yùn)營(yíng)商已經(jīng)有較好客戶基礎(chǔ)的智能醫(yī)療、智能安防、智慧城市等應(yīng)用場(chǎng)景。還有,加快原生多模態(tài)工具包的產(chǎn)品研發(fā),以MaaS、API等形式向社會(huì)輸出原生多模態(tài)能力。最后,加快端側(cè)多模態(tài)大模型的研發(fā)和自主品牌端側(cè)終端設(shè)備研發(fā)推廣,增加5G流量入口,如端側(cè)AI智能眼鏡和耳機(jī)等占據(jù)人類聽(tīng)覺(jué)和視覺(jué)系統(tǒng)的智能穿戴設(shè)備。
本文作者
張小東
戰(zhàn)略發(fā)展研究所
一級(jí)分析師
碩士,長(zhǎng)期從事數(shù)字產(chǎn)業(yè)發(fā)展和政策研究,近年來(lái)專注于數(shù)字產(chǎn)業(yè)、合規(guī)管理、數(shù)字出海業(yè)務(wù)研究等領(lǐng)域。
佘叢國(guó)
戰(zhàn)略發(fā)展研究所
高級(jí)分析師
西安交通大學(xué)企業(yè)管理碩士,長(zhǎng)期從事數(shù)字產(chǎn)業(yè)和企業(yè)戰(zhàn)略研究與咨詢,近年來(lái)主要專注于AI大模型產(chǎn)業(yè)研究。
段惠斌
大數(shù)據(jù)與人工智能研究所
高級(jí)工程師,近年主要專注于行業(yè)大模型方案研究和技術(shù)落地工作。
申紅梅
戰(zhàn)略發(fā)展研究所
一級(jí)分析師
碩士,高級(jí)工程師,就職于中國(guó)電信研究院,主要從事數(shù)字經(jīng)濟(jì)重點(diǎn)領(lǐng)域及通信行業(yè)競(jìng)爭(zhēng)對(duì)標(biāo)等相關(guān)研究。