谁在阔绰5万亿模子算力？

　　作家：郑晨烨配资选择建议

　　封图：图虫创意

　　2026年2月9日至2月15日，在线东谈主工智能托管平台OpenRouter发布了一组数据：中国大模子的单周调用量达到4.12万亿Token，历史上初度卓越好意思国模子的2.94万亿Token。

　　OpenRouter是一个团聚群众大模子接口的平台，被称为东谈主工智能界的“超等接口”。开发者不需要逐个去注册大模子公司的账号，只需通过该平台的协调接口，就能解放调用群众各家公司推出的万般模子，因此，该平台的使用量数据经常被视为群众大模子受宽贷进程和信得过应用强度的风向标。

　　紧接着的2月16日至2月22日这一周，中国大模子的周调用量进一步冲高至5.16万亿Token，三周内增长了127%，在当周群众大模子周调用量排行前五的榜单中，MiniMax M2.5、月之暗面Kimi K2.5、智谱GLM-5与深度求索DeepSeek V3.2占据了四个席位。

　　左证官方用户数据，在OpenRouter平台近47.17%的用户来自好意思国、中国开发者仅占6.01%的配景下，这组数据反馈出外洋开发者对中国模子的使宅心愿正在快速高潮。

　　Token是东谈主工智能照顾说话的基本单元。在算力阛阓中，Token调用量是算计大模子使用强度、贸易价值与浸透深度的中枢贪图，外洋开发者对中国模子的高频调用，记号着东谈主工智能产业的要点正在发生转换，行业不再单纯比拼构建大模子时的“一次性试验资本”，而是进入了高频度、常态化的“应用推理”阶段。

　　应用要点的转移凯旋导致了下贱采购圭臬的转向，国产AI芯片厂商也由此得到了加速进入阛阓的契机。

　　五万亿Token流向了那处

元股证券:yy6699.vip

　　要厘清这五万亿Token的去处，最初需要不雅察用户使用东谈主工智能的神气发生了什么变化。

　　左证OpenRouter与风险投资机构a16z联合发布的《2025 AI使用讲述》，该平台照顾的编程任务Token占比已从2025岁首的11%增多到了50%以上，成为最大的单一使用品类。这一滑变背后，是东谈主工智能应用格局从“问答式”向“智能体（Agent）”格局的切换。

　　在早期的问答格局下，用户提一个问题，模子给出一个回答，单次交互阔绰的Token经常在几百到几千个之间。一朝用户住手发问，阔绰也就随之住手。但进入智能体格局后，东谈主工智能初始在后台执续实行多要领任务。

　　上海一家算力芯片厂商的负责东谈主告诉记者，以编程场景为例，一个智能体在汲取到提醒后，会经验编写代码、运行测试、识别报错、自我修正、再次运行的轮回，为了让机器记着此前的操作，每次调用都需要捎带竣工的对话历史。

　　比如，当今国产大模子诸如智谱GLM-5等新一代模子照旧支执200K（约20万Token）的超长迂回文窗口。这种多轮自我修正和器具链级联的格局，使得单次活跃会话的Token蒙胧量呈几何级数增长。

　　另外，多模态应用的落地则进一步推高了阔绰量。左证公开数据，岁首爆火的Seedance 2.0视频模子生成一条10秒、1080p规格的视频，大致需要阔绰35万Token。

　　视频生成场景单元时刻内产生的Token阔绰，是传统文本问答的数百倍。

　　“刻下数万亿Token级别的调用量，已不再主要由测试性场景构成，而是由一批高频、边界化、可执续付费的贸易应用所复古。”弗若斯特沙利文（Frost & Sullivan）中国业务主宰合资东谈主兼董事总司理陆景向经济不雅察报记者暗示。

　　陆景先容，从新豹磋议院对国内大模子贸易生态的调研来看，当今都集买单的领域主要包括互联网、金融、跨境电商与文娱行业。

　　具体场景则涵盖了以下三类：第一类是企业级应用，如智能客服、智能营销、代码扶直开发、办公自动化器具等，这类应用在金融、电商、游戏行业已终了边界化部署；第二类是互联网平台中的生成式内容干事，包括智能搜索、对话式助手与诬捏脚色；第三类是AIGC（东谈主工智能生成内容）坐褥器具，如短视频剧本生成、告白案牍创作、跨境电商商品描述生成等。

　　这些行业的共同特征是，业务过程中存在高比例的文本或多模态内容生成需求，且企业大略邻接大模子干事产生的算力资本。

　　2026年2月10日，在郑州举行的“国产万卡算力赋能大模子发展研讨会”上，中国科学院自动化所磋议员陈盈盈暗示，驱动行业发展的中枢能源依然是大算力、大数据与大参数。但跟着模子参数目增长带来的性能擢升进入瓶颈期，行业正迈向智能体、合成数据和推理策画，数据决定了东谈主工智能的高度，环境将决定模子演进的标的。

　　应用格局的转变，阐扬了调用量为何飙升，那为何国产大模子又能在新的范式下，邻接住来欢跃众高频的调用需求呢？

　　前述算力芯片厂商负责东谈主告诉记者，当今，MiniMax M2.5、Kimi K2.5等国产模子多数给与了“夹杂大家（MoE）”架构。与传统的高贵模子（Dense Model）在每次运算时都要激活沿途参数不同，MoE架构通过按需激活特定的大家网罗，使推理时的显存占用镌汰了约60%，蒙胧量得到显耀擢升。

　　高贵模子的想象逻辑是，照顾每一个输入央求时，神经网罗中的每一个参数都必须参与策画。这意味着跟着模子边界的增大，所需的算力与显存支拨会同步呈线性增长。

　　夹杂大家架构则转变了这种全量运算的格局，它将模子参数差别为多个功能组，即“大家”，在实行具体任务时，路由系统会识别需求并只激活与之关联的部分参数。这种单干机制使得模子不错在保执纷乱参数目的同期，大幅镌汰单次推理所需的灵验算力。

　　工夫上的优化凯旋反馈在了售价上。当今中国模子的输入价钱约为0.3好意思元/百万Token，而部分外洋同类家具的价钱在5好意思元掌握。此外，电力资本亦然一个变量，中国西部算力节点的电力资本约为每度0.2元至0.3元，而泰西地区的资本在1元至1.5元之间。

　　这种资本上风促成了供需联系的再均衡。2026年春节时间，国产大模子迎来密集发布潮。2月11日，智谱上线底座模子GLM-5；2月12日，MiniMax开源文本模子M2.5；2月14日，字节向上发布豆包大模子2.0系列，与此同期，大厂围绕AI应用的红包战同步打响：百度参加5亿元，腾讯元宝10亿元，阿里推出30亿元免单运筹帷幄。

　　密集的应用落地也拉动了算力阔绰的急剧攀升。公开数据显现，中国日均Token阔绰从2024岁首的1000亿攀升至2026年2月的180万亿级别，在这种爆发式的需求驱动下，此前深陷价钱战的国内大模子厂商初始集体调头。

　　比如，2026年2月12日，智谱AI在发布新模子的同期，晓谕上调其API（应用标准编程接口）调用价钱，部分外洋订阅价钱涨幅达到30%至60%，API调用价钱涨幅最高达到100%。智谱对此酬报称，用户边界与调用量快速擢升，公司需同步加大算力参加。另外，月之暗面旗下的Kimi K2.5发布不到一个月，凤凰证券，凤凰证券配资，香港凤凰证券公司其外洋收入便卓越了国内收入。

　　也等于说，大模子公司正在告别蚀本引流的价钱战，初始有了实打实的业务收入。五万亿Token的流向标明，东谈主工智能正在从单纯的对话框，更动为金融、电商与编程场景中在后台自动运转的工业过程。

　　而顺着这股成倍增长的数据流往上游看，那些承载运算任务的智算中心，挑选算力硬件的目光也发生了变化。

　　算力采购的圭臬变了

　　算力阛阓的中枢贪图正在从掳掠策画卡转向核算单元产出资本。

　　2025年，中国GPU算力租出阛阓经验了价钱下调。比如，英伟达H100策画卡的租出价钱从岑岭时的每小时90多元东谈主民币，跌至15元到20元；A100的价钱则降至每小时3元到5元。

　　这种价钱走势背后是采购逻辑的更迭。在大模子开发初期，由于高性能芯片稀缺，阛阓处于资源囤积阶段，追求的是单卡的算力峰值（FLOPS）。但当推理负载成为常态后，企业初始核算总领有资本（TCO）。

　　“客户不再只盯着单卡的迷漫算力峰值，而是初始策画每参加一元钱能疏导些许蒙胧量，每阔绰一瓦电能照顾些许Token。”前述算力芯片厂商负责东谈主向经济不雅察报记者暗示。

　　该负责东谈主以为，刻下的算力需求呈现出推理与渲染的双重特征。除了文本生成，AI智能体云底座、云手机、数字孪生及工业仿真等场景对及时交互的需求，正在拉动对全功能GPU的采购。进入推理阶段之后，国产芯片迎来了切入窗口——试验阶段行业高度依赖英伟达的CUDA生态，而推理任务则更聚焦于能耗、巩固性和供应安全。

　　TrendForce集邦盘考分析师龚明德在回复经济不雅察报记者采访时亦展望，2026年推理型AI干事器在举座出货结构中的比重有望擢升至44%，相较于2025年高潮3个百分点。

　　龚明德以为，比较追求算力密度的大模子试验集群，推理型干事器在底层硬件架构想象上更凝视性价比和能效比，推理端对高端封装（如CoWoS）和高带宽内存（HBM）的严苛条件有所下调。

　　在龚明德看来，这种规格的放宽，故意于中国脉土企业在取得HBM受限的情况下，发展中等边界算力的推理芯片，并在互联网、车载系统等领域提供契机。

炒股网站

　　跟着行业要点转向推理和微调，企业客户在运筹帷幄智算中心预算时，参加结构也发生了转变。

　　对此，陆景分析称，当年在试验阶段，参加主要都集在高端试验型GPU集群、超高速互联网罗以及高性能存储系统，以感奋永劫刻、高并行度的试验需求。而在推理需求增长的配景下，企业初始更多给与推理优化型GPU、国产AI芯片或异构算力组合。在参加结构中，软件平台、算力退换、模子优化器具以及推理加速框架的占比迟缓擢升。

　　陆景以为，国内东谈主工智能芯片在底层软件生态诞生方面，正处于由可用向边界化商用过渡的阶段，主要国产芯片厂商已构建起包括驱动层、编译器、算子库、运行时环境在内的基础器具链体系，大略支执大模子试验、推理及智算中心部署。

　　当今的算力采购也照旧从单卡送测进入了系统级工程委用阶段。由于推理任务对响应延长极其明锐，万卡边界的集群在协同职责中，网罗通讯和散热才气时常比单张策画卡的“跑分”更具决定性。

　　2026年2月5日，国度超算互联网郑州中枢节点追究上线试运行。在这个节点上，部署了3套由中科晨曦（603019.SH）提供的scaleX万卡超集群，最大可提供卓越3万张国产加速卡的算力，这是天下首个终了3万卡部署且践诺参加运营的国产AI算力池。

　　中科晨曦高等副总裁李斌告诉经济不雅察报记者，郑州中枢节点的上线，考据了国产算力基础要领的工程化才气，行业已从早期的单点冲破，转向大边界落地部署。此前各家厂商在硬件想象、软件栈和互连协议上自成体系，导致算力资源难以跨平台退换。

　　“万卡集群的落地不仅是IT工夫问题，更是冷却、供电等跨学科的工程化挑战。”李斌强调，若是单点工夫出现短板，会凯旋牵扯扫数系统的效果，当今的系统研制冲破了传统IT工夫与其他工程工夫的勾通瓶颈。

　　当今，该国产算力系统已完成了千款应用的适配。左证国度超算互联网郑州中枢节点运维主任安磊的先容，超算互联网第一期已有645家第三方商家适配了该节点，卓越7200款软件和源码接入。

　　在这些资源的支执下，已有卓越70%的国产新能源汽车在该平台上进行流体和碰撞仿信得过验，举例，针对国度新出台的表率可能条件禁用新能源车灭亡把手的变化，车企需要诈欺大集群模拟门把手改为绽放式后对能效与风阻的影响。

　　此外，该集群还复古了国产羽绒服顶级面料的研发，以及为国际挥霍品牌提供智算资源支执其在国内的优化想象。

　　这种由下贱应用爆发倒逼上游基建升级的逻辑，也正在滚动为国产芯片厂商的业务收入。比如，左证2026岁首中国挪动的东谈主工智能通用策画蛊惑集采罢休，在总价值卓越50亿元的订单中，采购推理型AI干事器7499台。其中，华为昇腾系厂商斩获了34亿元的份额，昆仑工夫等国产企业的占比显耀擢升。

　　另外，国产算力厂商的事迹也在当年一年终光显爆发性增长。比如，2月27日，寒武纪（688256.SH）发布的事迹快报显现，2025年营收增长453.21%，达到64.97亿元，并终光显20.59亿元的归母净利润，这是该公司上市以来的初度年度盈利，寒武纪暗示，收入增长受益于东谈主工智能行业算力需求的攀升，公司鼓吹了应用场景的落地。相同地，摩尔线程（688795）、沐曦股份（688802）、海光信息（688041.SH）2025年度的事迹阐扬亦均有大幅擢升。

　　瀚博半导体首创东谈主兼CEO钱军则向经济不雅察报记者暗示，物理东谈主工智能正接近重要拐点，终了路径依赖于从诬捏到现实的闭环。瀚博半导体成立于2018年12月，是一家国产高性能GPU芯片提供商。

　　钱军暗示，图形渲染算作构筑仿真与数字孪生的基础，是贯穿东谈主工智能与物理世界的第一步，该公司已在AI推理与云渲染领域成立了基本盘，当今其家具已在超10家头部互联网公司、多家运营商和央国企落地。

　　左证伯恩斯坦（Bernstein）发布的《2025年中国AI芯片产业讲述》，中国脉土AI芯片品牌阛阓浸透率已从2024年的约29%擢升至2025年的42%。这也意味着，在数万亿Token执续阔绰的背后，国产算力通过对行业应用的适配和资本结构的优化，正在完成从边际备选向阛阓首选的跨越。