AI赛道又添一位重量级选手。MiniMax公司刚刚祭出的M3大模型,凭借自研稀疏注意力架构,直接把编程能力拉到GPT-5.5和Gemini 3.1 Pro前面。

这把利器的核心叫MSA(MiniMax Sparse Attention),它干了件什么事呢?把长文本场景下的计算成本压到了传统模型的二十分之一,同时把上下文窗口撑到100万token。说白了,现在处理一本《三体》三部曲,M3能从头到尾不丢上下文,这在以前想都不敢想。

编程评测数据更狠。SWE-Bench Pro代码生成测试里,M3直接碾压GPT-5.5和Gemini 3.1 Pro,跟行业天花板Opus 4.7的差距已经小到可以忽略。SVG图形生成更是把Opus 4.7甩在身后——多模态能力不是盖的。

商业策略也很有意思。MiniMax同步上线了Token Plan订阅体系:从每月49元的Plus版(6亿token)到469元的Ultra版(55亿token),三档分层定价把从个人开发者到企业客户全给覆盖了。

行业人士普遍认为,M3的推出标志着国产大模型在核心技术自研上迈过了关键门槛。一个开源的、能打编程的、能处理百万级上下文的模型,对整个生态的冲击远比看起来大——智能客服、代码辅助、复杂文档分析,这些场景都将迎来新一轮洗牌。

值得一提的是,M3采用了开源策略。在当前国内大模型纷纷走向闭源商业化的大背景下,MiniMax选择开源无疑是一步险棋,但也可能是一步妙棋——开源意味着更快的生态建设速度和更低的开发者获取成本。对于中小企业和独立开发者来说,这是一个不可忽视的信号:一个免费可用、能打编程、能处理超长文本的国产模型,正在改变游戏规则。