下一个AI较量场,为什么是Harness?

下一个AI较量场,为什么是Harness?

Agents aren't hard; the Harness is hard.

2026年2月,当OpenAI工程师Ryan Lopopolo用这句话概括他刚完成的项目时,大多数人还不理解他的感慨。他带着一个不到10人的小团队,用5个月时间,让Codex写出了超过100万行代码,全程没有手敲一行。这套能让模型可靠地工作的系统,被他称之为Harness Engineering。

据公开信息,Codex的周活跃用户在3月初还是160万左右,但到了5月,已经超过了400万。除了模型的升级,Codex的Harness能力也为它赢来不少用户。

如今AI圈已经广泛认可 Agent = Model + Harness 这一条公式。如果Agent是一辆车,大模型就是提供马力的发动机。没有发动机,一切无从谈起。但一台裸发动机放在地上,你也没法开它上路。Harness,就是把发动机变成整车的那套系统工程。

就在本月,DeepSeek发布了两个招聘岗位:Harness产品经理和Harness研发工程师。这一家以模型层突破著称的公司,也把下一步的筹码押在了Harness上。

一、Harness洗牌行业三层结构

过去几年,AI产业被默认分成三层结构:基础设施层、模型层和应用层。现在Harness开始影响这个利益蛋糕的分配。

模型公司首先感受到是兑现权被拿走了一部分。应用层的变化也在发生,过去不少应用公司的护城河是懂业务,现在这些东西开始往Harness搬。基础设施层也没法置身事外,因为算力市场的需求会被反向定义——英伟达在2026年发布的Vera Rubin平台,就是专为智能体和大规模推理时代而构建。

二、Harness天然长在场景里

Harness不是一个即插可用的插件,它必须在真实场景的失败里磨出来。最先被验证的是代码场景,但代码之外的世界没有编译器,要复杂得多。

有真实业务反馈的玩家,已经开始在Harness上显示出优势。比如Salesforce的Agentforce已经按Agent对话收费,ARR达8亿美元,全年增速169%。目前国内日活第一的Agent腾讯WorkBuddy,也很早就押注Harness的玩家。

三、标准化与智能体生态之争

Agent的标准化竞争已经开始。Anthropic推出MCP,Google推出A2A协议。在国内,腾讯、阿里、字节都在跟进。今年5月,中国信通院联合腾讯、华为等共同发布了ATH协议,通过用户、Agent与服务的三方握手来确定权限边界。

结语

模型依然是基本盘,但随着Harness的影响在扩大,每一家AI公司接下来要回答的都不再只是我的模型有多强,还要想清楚自己在Harness搅动的新AI格局里,要站在哪里。