AI大模型服務(wù)正面臨嚴(yán)峻的算力考驗。
進入2026年,人工智能大模型行業(yè)競爭步入白熱化階段。春節(jié)前,騰訊元寶、阿里千問、字節(jié)跳動豆包等大廠集中發(fā)力C端市場,通過各類福利活動掀起用戶“爭奪戰(zhàn)”。春節(jié)假期至今,全球大模型賽道融資消息也密集落地,資本熱度持續(xù)攀升。
然而,伴隨用戶規(guī)模與使用頻次的激增,Token(詞元)消耗量顯著增長,大模型服務(wù)正面臨嚴(yán)峻的算力考驗。
春節(jié)期間,豆包因春晚高頻互動導(dǎo)致算力承壓,一度暫停視頻通話功能;智譜AI等廠商也因高并發(fā)請求采取了API限流等措施。算力供給不足、推理資源緊張,已成為當(dāng)前大模型規(guī)模化落地過程中亟待解決的核心難題。
國產(chǎn)大模型霸榜OpenRouter
自2025年初DeepSeek橫空出世、驚艷全球以來,中國大模型產(chǎn)業(yè)快速崛起,憑借獨特的技術(shù)與場景優(yōu)勢持續(xù)霸榜全球。
據(jù)全球最大的大模型API聚合平臺OpenRouter數(shù)據(jù)顯示,2月平臺內(nèi)前十模型總Token消耗量已突破27萬億,國產(chǎn)模型貢獻(xiàn)超過14萬億,市場占比超過50%。
其中,MiniMax M2.5以超過5萬億的Token消耗位居全球榜首;Kimi K2.5緊隨其后,2月Token總消耗量超過4萬億;DeepSeek V3.2、GLM 5分別位列第四、第八位。這些頭部國產(chǎn)大模型,普遍聚焦于代碼能力與智能體(Agent)自動化任務(wù)的能力提升。
從春節(jié)期間的消耗量來看,2月16日至22日(農(nóng)歷除夕至正月初六),OpenRouter平臺Token消耗量前十的大模型中,中國大模型份額占比已超60%。其中,MiniMax M2.5、GLM-5 消耗量環(huán)比大幅增長,增幅分別達(dá)到197%和158%。
反觀全球市場,谷歌、xAI、OpenAI等海外廠商旗下大模型的Token消耗量增速明顯低于國內(nèi)模型,全球市場份額增長乏力,部分甚至出現(xiàn)負(fù)增長。

Token消耗量或開啟多年增長模式
Token(詞元),即AI處理信息的最小單位。大模型每生成一個Token,后端的服務(wù)器就得高速運轉(zhuǎn),這不僅需要強大的算力,更需要大量的電力。根據(jù)業(yè)內(nèi)測算,Token生成的成本結(jié)構(gòu)中,電力及算力的成本占比超過七成。
摩根大通的報告顯示,基于用戶情境的預(yù)測,從應(yīng)用采用的角度出發(fā),Token消耗量或開啟多年增長期。中國的AI推理Token消耗量預(yù)計將從2025年的超10千萬億增長至2030年的約3900千萬億,增幅接近369倍,主要受兩個復(fù)合要素推動,一是隨著AI成為搜索、內(nèi)容生成、客戶服務(wù)和生產(chǎn)力的默認(rèn)界面,AI在消費者用戶和企業(yè)工作負(fù)載中的滲透率都在提高;二是用例從對話AI擴展到智能體和多模態(tài)輸出(更長的上下文、更多的工具調(diào)用、更豐富的輸出),即使用戶數(shù)量增長放緩,這也會實際增加每個會話的Token。
從細(xì)分領(lǐng)域來看,隨著時間的推移,推理需求的占比發(fā)生明顯變化。對話AI占2025年預(yù)期Token總消耗量的近一半,預(yù)計到2030年逐步下降至高個位數(shù)百分比;生活情景AI智能體的份額預(yù)計將從2025年的個位數(shù)提高至2030年的10%至20%。

國產(chǎn)大模型具備電力的算力的雙重優(yōu)勢
對于開發(fā)者而言,性價比是硬道理。從國內(nèi)來看,無論是電力還是算力,都具備顯著的成本優(yōu)勢,并有望重構(gòu)AI定價權(quán)。
從電力來看,國家能源局?jǐn)?shù)據(jù)顯示,截至2025年底,我國累計發(fā)電裝機容量達(dá)38.9億千瓦,同比增長16.1%,發(fā)電量占全球總量的三分之一。我國也成為全球首個全社會用電量突破10萬億千瓦時的國家,電力供給充足且成本優(yōu)勢顯著。AI熱潮之下,美國電價呈現(xiàn)明顯上漲趨勢,進一步凸顯我國電力成本的競爭力。
從算力來看,早在2025年10月份,央視網(wǎng)報道,“十四五”時期以來,中國開啟新一輪數(shù)字基礎(chǔ)設(shè)施大布局,全國一體化算力網(wǎng)連通東西南北,算力總規(guī)模躍居全球第二,不僅為中國數(shù)字經(jīng)濟的成長澆筑新的基座,也創(chuàng)造了增長的新機遇。
目前,國內(nèi)多家頭部算力企業(yè)已構(gòu)建起完備的適配體系,在推理環(huán)節(jié)有效突破海外技術(shù)壟斷,服務(wù)器、光模塊、散熱等關(guān)鍵硬件環(huán)節(jié)也基本實現(xiàn)自主可控。依托規(guī)模化部署、低成本電力供給與算法持續(xù)迭代,國產(chǎn)方案在主流應(yīng)用場景中的Token生產(chǎn)成本具備明顯優(yōu)勢。
業(yè)內(nèi)普遍認(rèn)為,國產(chǎn)大模型憑借更高效的架構(gòu)設(shè)計,逐步降低對高端GPU的剛性依賴;而全球開發(fā)者對中國大模型的廣泛選用,進一步拉動國產(chǎn)算力需求呈現(xiàn)爆發(fā)式增長。
14只籌碼集中大模型概念股出爐
盡管在最近幾個交易日的行情中,算力板塊表現(xiàn)有明顯分化,但不可否認(rèn)的是,算力需求提升是必然趨勢。在以周度進行統(tǒng)計的周期中,國產(chǎn)大模型Token消耗量更是一度超過美國(2026年2月9日至15日),后續(xù)優(yōu)勢持續(xù)擴大,多重利好因素的加持下,Token出海有望成為趨勢。
證券時報·數(shù)據(jù)寶根據(jù)萬得、同花順等公開信息梳理,A股市場中屬于智譜、Kimi、DeepSeek及MiniMax主流大模型的概念公司有140余家。
從市場表現(xiàn)來看,截至2月27日,這140余只概念股今年以來平均漲幅超過13%,杰創(chuàng)智能、藍(lán)色光標(biāo)及中控技術(shù)今年以來累計漲幅均超過60%,前2只個股涉及智譜概念,中控技術(shù)則涉及DeepSeek概念。首都在線、金現(xiàn)代、優(yōu)刻得-W今年以來累計漲幅均超過40%,3家公司均涉及智譜概念。
從籌碼變化情況來看,最新股東戶數(shù)較2025年年末下降的概念股有14只,3只概念股的股東戶數(shù)下降幅度超過10%,分別是世紀(jì)天鴻、恒為科技及遠(yuǎn)光軟件。
世紀(jì)天鴻最新股東戶數(shù)較去年末下降近24%,公司以自身戰(zhàn)略定位和資源稟賦為出發(fā)點,結(jié)合人工智能技術(shù)已推出了基于大語言模型研發(fā)的專注于服務(wù)老師的AI智能體“小鴻助教”,并投資了基于人工智能NLP(自然語言處理)技術(shù)、聚焦中小學(xué)寫作場景的人工智能輔助寫作產(chǎn)品“筆神作文”。
恒為科技最新股東戶數(shù)較去年末下降超過21%。公司2025年2月份表示,其推出的昇騰、DeepSeek一體機分為訓(xùn)推一體機與推理一體機兩種類型,以“開箱即用+高并發(fā)低時延”為核心優(yōu)勢,覆蓋金融、政務(wù)、科研、醫(yī)療等眾多垂直行業(yè),助力行業(yè)實現(xiàn)智能化升級。
遠(yuǎn)光軟件最新股東戶數(shù)較去年末下降10.6%。目前公司主要接入或適配了智譜、阿里千問、DeepSeek、盤古等大模型。
這14只概念股今年以來平均漲幅超過9%,恒為科技、世紀(jì)天鴻、值得買漲幅居前,均超過15%。太極股份、浪潮信息、宇信科技表現(xiàn)較弱,今年以來股價均呈下跌局面,其中浪潮信息服務(wù)器市占率全球領(lǐng)先,涉及DeepSeek及MiniMax概念。
