AI 观察👀

记录、思考,but AI

刊载于

中国AI"春节档"升级战:智谱GLM-5开源对决DeepSeek V4,美国科技巨头豪掷6900亿押注AI基建

中国AI大模型"春节档"迎来史上最激烈发布潮:智谱GLM-5正式开源、DeepSeek支持1M Token超长上下文、MiniMax M2.5对标Claude Opus 4.6。与此同时,美国五大科技巨头宣布2026年AI基建投资将达6900亿美元,创历史纪录。

AI 分析 行业动态 智谱AI DeepSeek MiniMax 数据中心 中美竞争

如果说2025年春节是DeepSeek”单骑闯关”震惊全球的时刻,那么2026年春节已经演变成一场中国AI企业的”集体冲锋”——智谱、DeepSeek、MiniMax、字节跳动在同一天窗口密集发布旗舰模型,直接对标OpenAI和Anthropic的最新产品。与此同时,大西洋彼岸的亚马逊、谷歌、微软、Meta和甲骨文正在以前所未有的规模押注AI基础设施,合计投资逼近7000亿美元。

中国AI”春节档”升级战:智谱GLM-5开源对决DeepSeek V4,美国科技巨头豪掷6900亿押注AI基建

当中国AI公司选择在农历新年期间集中发布新产品时,这已不再是一次简单的营销策略,而是一场关于”谁能最快将技术溢出转化为消费级爆款”的抢凳子游戏。2026年2月11日至12日,智谱GLM-5正式开源、DeepSeek宣布支持1M Token超长上下文、MiniMax M2.5对标Claude Opus 4.6——这场”春节档”发布潮正在改写全球AI竞争格局。

智谱GLM-5开源:国产编程模型首次对齐Claude Opus 4.5

新闻概述:2026年2月11日深夜,智谱AI正式发布新一代旗舰模型GLM-5,并于2月12日全面开源。该模型在编程(Coding)与智能体(Agent)能力上取得开源SOTA(State-of-the-Art)表现,在真实编程场景的使用体感逼近Claude Opus 4.5。

核心参数升级

  • 参数规模从355B(激活32B)扩展至744B(激活40B)
  • 预训练数据从23T提升至28.5T
  • 在SWE-bench-Verified基准测试中取得77.8分,为开源模型最高
  • 在Terminal Bench 2.0中获得56.2分,超越Gemini 3 Pro

为什么这很重要:这是国产开源模型首次在核心编程能力上实现对顶级闭源模型的对齐。智谱AI在官方博客中明确提出,大模型正在从”写代码、写前端”进化到”写工程、完成大任务”,即从”Vibe Coding”变革为”Agentic Engineering”。

技术创新:稀疏注意力与国产芯片适配

GLM-5的技术亮点包括:

  1. 稀疏注意力机制:首次集成DeepSeek Sparse Attention,在维持长文本效果无损的同时,大幅降低模型部署成本
  2. 异步强化学习:构建全新的”Slime”框架,支持更大模型规模及更复杂的强化学习任务
  3. 国产芯片全面适配:已完成与华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光等国产算力平台的深度推理适配

历史上的类似突破

这一突破与2023年3月Meta发布LLaMA有相似之处。当时,Meta开源的LLaMA模型虽然参数量小于GPT-3,但凭借高质量的训练数据和开源策略,迅速催生了Alpaca、Vicuna等一系列衍生模型,推动了开源大模型生态的爆发。

GLM-5的不同之处在于:它不是追赶者,而是在特定领域(编程与Agent)达到了与顶级闭源模型相当的水平。这标志着中国开源大模型从”跟随”进入”并跑”阶段。

DeepSeek V4箭在弦上:1M Token超长上下文意味着什么?

新闻概述:2月11日,DeepSeek对网页及App端进行版本更新,将模型上下文长度提升至1M(百万)Token,可一次性处理《三体》全集这样的超长文本,跻身全球少数实现该突破的模型行列。

技术背景:DeepSeek团队在2026年初发表的论文中提出了Engram(条件记忆模块)创新架构,这项技术显著降低长上下文推理成本。市场预期DeepSeek V4将于2月中旬正式发布,重点改进编码和超长提示词处理。

100万Token能做什么?

1M Token的上下文窗口意味着:

  • 可以一次性阅读约750,000个英文单词或500,000个汉字
  • 相当于10本中等长度的小说
  • 可以完整处理《三体》三部曲级别的超长文本
  • 支持数百万行代码库的全局理解

与Claude Opus 4.6的对标

值得注意的是,Anthropic刚刚在2月5日发布的Claude Opus 4.6也首次支持1M Token上下文窗口。这表明超长上下文已成为顶级大模型的”标配”能力。

但DeepSeek的差异点在于成本效率。摩根大通分析师指出,DeepSeek提出的”条件内存”技术”不仅仅是模型变轻了,而是将昂贵的密集计算转移到了更便宜的检索操作上”。这意味着如果技术实施如论文所述,DeepSeek可能实现推理成本的显著降低。

MiniMax M2.5:首个Agent原生生产级模型

新闻概述:2月12日,MiniMax上线最新旗舰编程模型M2.5,定位为”全球首个为Agent场景原生设计的生产级模型”,直接对标Claude Opus 4.6。

核心优势

  • 激活参数量为10B,在显存占用和推理能效比上有优势
  • 推理速度超过国际顶尖模型
  • 尤其适配Excel高阶处理、深度调研、PPT等生产力场景

为什么Agent原生设计重要?

传统大模型是为”对话”优化的,而Agent场景需要模型具备:

  • 长程规划能力:在多步骤任务中保持目标一致性
  • 工具调用能力:正确选择和使用外部工具
  • 错误恢复能力:在失败后自动调整策略

MiniMax M2.5的发布标志着大模型竞争进入”Agent优先”的新阶段。这与Anthropic和OpenAI的最新动向一致——Claude Opus 4.6和GPT-5.3 Codex都在强调长程Agent任务执行能力。

美国科技巨头6900亿美元基建豪赌:AI基础设施竞赛升级

新闻概述:根据Futurum Research的最新分析,美国五大云和AI基础设施提供商——微软、Alphabet、亚马逊、Meta和甲骨文——在2026年的合计资本支出计划已达到6600亿至6900亿美元,较2025年近乎翻倍。

投资明细

公司2026年资本支出计划同比变化
亚马逊2000亿美元大幅超预期(共识预期1470亿)
Alphabet1750-1850亿美元三次上调(初始预期710-730亿)
微软1200亿美元以上持续加速
Meta1150-1350亿美元包括1GW俄亥俄数据中心
甲骨文500亿美元同比增长136%

为什么这些公司敢于如此激进投资?

  1. 市场需求远超供给:微软披露有800亿美元的Azure订单因电力限制无法履约
  2. 云业务快速增长:AWS年收入率达到1420亿美元,同比增长24%
  3. AI服务供不应求:所有超大规模云服务商都报告AI容量”即建即用”

历史上的基础设施投资浪潮

这波投资让人联想到几个历史先例:

1. 铁路狂热(1840年代英国):铁路投资占GDP比重一度超过5%,最终导致泡沫破裂,但留下了一整套基础设施

2. 州际高速公路系统(1950-60年代美国):投资占GDP约2%,彻底改变了美国经济地理

3. 互联网基础设施建设(1990-2000年代):光纤网络过度投资导致泡沫,但为后续互联网爆发奠定了基础

AI基建投资的独特之处在于:它的回报周期可能比铁路和高速公路更短,因为AI服务可以即时产生收入。

收入与投资的巨大差距

值得警惕的是,AI模型厂商的收入与基建投资之间存在巨大差距:

  • OpenAI 2025年末年化收入约200亿美元
  • Anthropic 2026年1月收入率达到90亿美元
  • 所有纯AI模型厂商的合计年收入预计不到350亿美元

这意味着AI模型厂商的收入仅占超大规模云服务商2026年资本支出的约5%。Futurum Research分析师Nick Patience指出:“基础设施建设远超前收入实现,这带来了执行风险。“

中美AI竞争的新格局

综合以上新闻,我们可以看到中美AI竞争正在呈现新的格局:

中国AI:效率优先、开源制胜

中国AI企业的策略越来越清晰:

  • 效率创新:DeepSeek的”条件内存”、智谱的”稀疏注意力”都聚焦于降低成本
  • 开源生态:GLM-5遵循MIT License开源,推动生态繁荣
  • 应用落地:从”对话工具”向”AI内嵌”转变,目标是微信等高频应用

摩根大通分析师认为,如果DeepSeek V4实现推理降本,“人工智能就能经济地直接嵌入高频消费产品,而不再是单独的聊天机器”。这意味着腾讯可能成为最大受益者,因为微信和QQ是中国最高频的通信界面。

美国AI:规模优先、基建先行

美国AI企业的策略则是:

  • 规模扩张:6900亿美元的基建投资押注AI需求将持续爆发
  • 闭源优势:OpenAI和Anthropic保持技术领先,通过API服务获取收入
  • 企业市场:微软、谷歌、亚马逊都在将AI深度整合到企业服务中

竞争的关键变量

  1. 电力约束:微软800亿美元订单无法履约的核心原因是电力供应不足
  2. 芯片限制:美国对华芯片出口管制仍在持续,华为2025年仅生产20万片AI芯片
  3. 开源生态:中国开源模型的质量提升正在改变全球开发者生态

关键要点

  • 智谱GLM-5开源:国产模型首次在编程能力上对齐Claude Opus 4.5,标志中国开源大模型从”跟随”进入”并跑”阶段
  • DeepSeek 1M Token:超长上下文成为顶级模型标配,成本效率创新是中国AI的核心竞争力
  • 美国6900亿基建投资:五大科技巨头近乎翻倍的投资押注AI需求将持续爆发,但收入与投资之间存在巨大差距
  • Agent优先时代:从”对话”到”Agent”是2026年大模型竞争的核心转向
  • 腾讯或成最大赢家:如果AI推理成本显著降低,微信等高频应用将成为AI内嵌的主要受益者

常见问题

中国AI模型与美国模型的差距还有多大?

根据智谱GLM-5的官方数据,在编程和Agent能力上,国产开源模型已经可以”逼近Claude Opus 4.5”的水平。在SWE-bench-Verified等权威基准测试中,GLM-5取得了开源模型最高分。这表明在特定领域,差距已大幅缩小,甚至在某些指标上实现超越。

美国科技巨头6900亿美元投资能收回成本吗?

目前存在较大不确定性。AI模型厂商的合计年收入(约350亿美元)仅占基建投资的5%左右。但超大规模云服务商并非仅为AI模型厂商建设基础设施,他们也在为自己的AI服务和更广泛的企业客户建设。关键在于AI采用速度能否跟上基础设施建设速度。

DeepSeek V4什么时候发布?

根据多家媒体报道,DeepSeek V4预计将于2026年2月中旬发布,目标锁定编码和超长提示词处理的改进。2月11日的更新已将上下文长度提升至1M Token,被视为V4发布前的技术预热。

为什么说腾讯可能成为中国AI的最大受益者?

摩根大通分析师的逻辑是:如果AI推理成本显著降低,AI就可以经济地嵌入高频消费产品。腾讯拥有微信和QQ这两个中国最高频的通信界面,日活跃用户数以亿计。将AI能力嵌入这些界面,将产生巨大的推理需求和应用场景。

普通开发者应该如何选择AI模型?

对于中国开发者:

  • 开源需求:GLM-5已全面开源(MIT License),成本最低
  • 编程场景:GLM-5和MiniMax M2.5都是优秀选择
  • 超长文本:DeepSeek的1M Token上下文是性价比最高的选择

对于需要顶级能力的用户,Claude Opus 4.6和GPT-5.3 Codex仍然是综合能力最强的选择,但成本较高。

参考资料