下一个AI较量场，为什么是Harness？

Agents aren't hard; the Harness is hard.

2026年2月，当OpenAI工程师Ryan Lopopolo用这句话概括他刚完成的项目时，大多数人还不理解他的感慨。他带着一个不到10人的小团队，用5个月时间，让Codex写出了超过100万行代码，全程没有手敲一行。这套能让模型可靠地工作的系统，被他称之为Harness Engineering。

据公开信息，Codex的周活跃用户在3月初还是160万左右，但到了5月，已经超过了400万。除了模型的升级，Codex的Harness能力也为它赢来不少用户。

如今AI圈已经广泛认可 Agent = Model + Harness 这一条公式。如果Agent是一辆车，大模型就是提供马力的发动机。没有发动机，一切无从谈起。但一台裸发动机放在地上，你也没法开它上路。Harness，就是把发动机变成整车的那套系统工程。

就在本月，DeepSeek发布了两个招聘岗位：Harness产品经理和Harness研发工程师。这一家以模型层突破著称的公司，也把下一步的筹码押在了Harness上。

一、Harness洗牌行业三层结构

过去几年，AI产业被默认分成三层结构：基础设施层、模型层和应用层。现在Harness开始影响这个利益蛋糕的分配。

模型公司首先感受到是兑现权被拿走了一部分。应用层的变化也在发生，过去不少应用公司的护城河是懂业务，现在这些东西开始往Harness搬。基础设施层也没法置身事外，因为算力市场的需求会被反向定义——英伟达在2026年发布的Vera Rubin平台，就是专为智能体和大规模推理时代而构建。

Harness不是一个即插可用的插件，它必须在真实场景的失败里磨出来。最先被验证的是代码场景，但代码之外的世界没有编译器，要复杂得多。

有真实业务反馈的玩家，已经开始在Harness上显示出优势。比如Salesforce的Agentforce已经按Agent对话收费，ARR达8亿美元，全年增速169%。目前国内日活第一的Agent腾讯WorkBuddy，也很早就押注Harness的玩家。

Agent的标准化竞争已经开始。Anthropic推出MCP，Google推出A2A协议。在国内，腾讯、阿里、字节都在跟进。今年5月，中国信通院联合腾讯、华为等共同发布了ATH协议，通过用户、Agent与服务的三方握手来确定权限边界。

模型依然是基本盘，但随着Harness的影响在扩大，每一家AI公司接下来要回答的都不再只是我的模型有多强，还要想清楚自己在Harness搅动的新AI格局里，要站在哪里。