信息来源:省工信院 | 发布时间:2025-07-25 10:30:51
一、热点聚焦
2025年7月,由UIUC、斯坦福、哈佛等顶级机构联合提出的Energy-Based Transformer(EBT)架构震撼发布,标志着统治AI领域多年的传统Transformer范式迎来重大革新。该架构首次将能量建模框架引入Transformer,显著改变了“前馈即推理”的静态计算模式,赋予AI动态优化、多轮反思的类人思考能力。实验表明,EBT在训练效率、分布外数据鲁棒性、多模态泛化性等核心指标上大幅超越前馈式Transformer,被学界视为实现无监督跨模态通用推理的关键突破,为AGI发展开辟全新路径。
二、锐评睿见
当前全球大模型竞争已进入“思考能力”决胜阶段。传统Transformer的静态推理机制如同“学生答题不许修改”,导致复杂任务中错误累积、逻辑僵化等固有缺陷。EBT架构的三大革命性突破,正为中国AI产业“弯道超车”提供战略机遇。
(一)破解“静态推理”困局,构建动态思考新范式
EBT的核心跃迁在于将推理重构为能量最小化优化过程,具有三大跃迁。动态计算资源分配。面对简单问题快速收敛,复杂问题自动增加“思考步数”,打破传统模型“一刀切”计算模式。显式不确定性建模。通过能量值量化预测可信度,解决连续模态不确定性表达难题。建议浙江依托之江实验室、阿里达摩院等平台,加速布局动态计算架构研发。支持头部企业攻关与EBT适配的异构计算芯片、能量优化算法库,打造“思考即服务”新型算力基础设施。
(二)打破模态壁垒,激活无监督跨模态通用推理
EBT的普适性设计直指AGI核心挑战。统一推理框架。仅需定义输入与候选预测,即可在文本、图像、视频等多模态场景中自主优化。跨模态泛化跃升。EBT作为第一个在多模态、多维度下超越Transformer++的模型,其意义不仅在于性能突破,更是代表了从“生成式预测”向“验证式思维”范式的转变,具有更强的泛化能力。建议浙江推动浙江大学、北航杭州研究院等高校院所联合头部企业,建设多模态EBT工业验证平台。重点推动“AI+制造”,在新能源汽车及零部件、高端新材料、现代纺织与服装等产业集群开展试点。
(三)重塑大模型竞争逻辑,构建“思考能力”护城河
当技术路线从“参数竞赛”转向“思维机制”创新,浙江需警惕三重风险。一是生态锁死危机。若国际巨头主导EBT开源框架,可能复制“Transformer+英伟达芯片”的垄断格局。二是算力需求跃迁。EBT多轮迭代推理将提升单任务计算负载,需重构绿色高效算力体系。三是伦理治理挑战。动态思考过程形成“认知黑箱”,传统可解释性工具面临失效风险。建议浙江支持制定EBT动态计算评估规范,在杭州国家新一代人工智能创新发展试验区先行试点;推动阿里巴巴“魔搭社区”联合之江实验室等平台,建设EBT中文开源模型库;设立AI思考伦理实验室,探索基于能量轨迹的决策审计新机制。
当前,人工智能正由Transformer架构的“感知应答”向“深度认知”跨越演进。以EBT、Mixture of Recursions (MoR)、Mixture of Experts (MoE)、Mamba为代表的后Transformer技术多点突破,推动智能计算范式发生根本性变革。面对新机遇,浙江亟需以“思维革命”重构大模型创新图谱——既要加速EBT基础研究与芯片适配,抢占通用智能制高点,更需前瞻布局伦理治理与开源生态,在智能文明新时代书写“浙江算法”新篇章。