AI安全的新维度:从生成风险到执行风险

2026年5月,多起安全事件将AI风险从理论讨论推向了现实层面。360 AI安全研究院发布的报告提出了一个振聋发聩的论断:随着智能体加速进入企业核心业务场景,AI安全的核心问题正在从"生成风险"转向"执行风险"。

这两者的区别至关重要。生成风险指的是AI产生虚假、有害或不当内容的问题,而执行风险指的是AI在执行任务时可能造成的实际损害——比如错误地操作数据库、不当处理敏感数据、或者执行超出授权范围的操作。当AI有了"手和脚"(即操作系统能力和API调用权限),后者的影响范围和严重程度远超前者的量级。

安全事件密集爆发

美国佛罗里达州检方宣布就一起枪击案对OpenAI及其ChatGPT发起刑事调查,这是AI产品首次在司法层面被追究刑事责任。谷歌威胁情报组确认,黑客利用AI大模型独立发现了一个存在于广泛使用的开源Web管理工具中的零日漏洞,该漏洞可以绕过双因素认证。

这两起事件分别代表了AI安全的两个层面:"AI利用"(如何使用AI作恶)和"AI责任"(AI不当行为由谁担责)。当AI的能力越来越强、应用场景越来越广,这两个层面的风险都在同步放大。

中国政策的快速响应机制

中国在AI安全治理方面展现了快速响应能力。5月8日,国家网信办、国家发改委、工信部联合发布《智能体规范应用与创新发展实施意见》,提出安全可控、规范有序等四大原则。5月11日,国务院办公厅将AI立法纳入2026年度立法工作计划。

全国人工智能科技伦理审查与服务先导计划同步启动,建立了全国AI伦理风险监测服务网络。从暂行办法到实施意见再到立法计划,政策演进路径清晰:中国AI治理正在从"鼓励发展"快速推进到"规范发展"阶段。

企业的安全应对策略

360提出了两条核心应对路径。第一条是用AI加持传统安全防护——利用AI提升漏洞发现、入侵研判、样本分析和响应处置的效率,以技术对抗技术。第二条是让不确定性任务在安全约束下执行——通过沙盒隔离、权限分级和操作审计等机制,确保智能体可以做事但不能越界。

阿里巴巴千问事业部上线的"引证"功能代表了另一种思路:在通用场景中内置事实复核机制。对新闻时事、政策动态等需要"有据可查"的问题,智能体会进行交叉验证并标注可信度等级。

清华大学薛澜教授指出,全链条安全框架的建立是智能体规模化应用的信任基础。合规能力正在成为企业的核心竞争力,特别是在金融和医疗等高监管领域。