昆仑万维SkyClaw闯入全球第一梯队:Agent模型的新竞赛

2026年5月26日,昆仑万维旗下天工AI发布了一款重磅产品——SkyClaw-v1.0高性能Agent模型,同时推出轻量化版本SkyClaw-v1.0-lite。这不仅是又一次模型发布,更是国产Agent模型正式跻身全球第一梯队的宣言。

从回答问题到执行任务

过去,大模型的核心价值在于理解和生成——回答问题、写文章、做翻译。但现在,模型的角色正在发生根本性转变:它需要被放进一个能读取仓库、调用工具、编辑文件、运行测试、观察反馈的执行环境里,承担完整的工作流。

SkyClaw-v1.0正是为这个新阶段而生。它支持百万token上下文,深度适配复杂工具调用、多轮任务执行、代码生成、文件编辑、交互式应用构建与研究型数据分析。模型可以在OpenClaw、Hermes、Nanobot等主流Agent环境中运行,同时适配Claude Code、Codex等代码Agent框架,通用性与兼容性拉满。

性能全面超越主流开源模型

在主流Agent基准测试和天工内部任务评测中,SkyClaw-v1.0展现出稳定的多步任务执行能力。它的表现超越了Minimax2.7、DeepSeek V4 Flash,以及多款Qwen3.6系列模型。在OpenClaw相关任务上,其表现甚至接近DeepSeek V4 Pro、Claude Opus4.6等更大规模的顶级模型。

更引人注目的是其定价策略——低于Minimax2.7与Qwen3.6系列模型的一半。这让高性能Agent能力具备了规模化调用的基础,大幅降低了企业和开发者的使用门槛。

独特的训练方法论

SkyClaw-v1.0的训练目标十分明确:提升模型在Agent框架中完成真实任务的能力。训练重点聚焦三件事:构建可交互的工具环境、筛选高质量任务轨迹、用强化学习提升多步执行稳定性。

训练环境基于OpenClaw风格的Agent框架构建,覆盖文件读取、代码编辑、检索、测试、页面观察等高频Agent动作。模型在训练中不只是生成答案,而是需要选择工具、组合工具,并根据工具返回结果继续推进任务。

强化学习阶段,优化目标从回答是否好看转向任务是否完成、过程是否稳定。这意味着模型在持续执行、错误恢复和多轮迭代方面的能力得到了系统性的提升。

实战能力全面验证

SkyClaw-v1.0在多个场景中展示了令人印象深刻的能力。在全形态界面设计方面,它可以生成具备生产级布局、真实导航流程和完整交互状态的应用界面。在游戏开发领域,它能生成可运行的交互式游戏与物理模拟。在研究分析方面,它能将自然语言需求转化为可交互的网页报告。

开放生态的野心

SkyClaw-v1.0已于5月22日接入天工Skywork,并开放免费试用。开发者可通过开放API免费调用,注册后即可通过兼容OpenAI格式的接口接入现有应用或Agent框架。

昆仑万维的布局很清晰:SkyClaw-v1.0不是一次孤立的模型发布,而是其AGI产品体系中的关键一环——把Agent从可演示推进到可高频调用、可真实交付的阶段。在Agent模型这条新赛道上,中国团队正在用实力证明,他们不仅是参与者,更是领跑者。