Anthropic 发布强大 AI 漏洞检测工具——附加限制条件

简要回答
Anthropic 发布了两款新 AI 模型:面向公众且具备防滥用保护的 Claude Fable 5,以及仅供网络安全专家使用的漏洞检测工具 Mythos 5。
Anthropic 推出了两款新的人工智能模型:Claude Fable 5 和 Mythos 5。两者均展现出强大的分析能力,但面向不同的用户群体。
Fable 5 将向公众开放,定位为解决复杂任务的通用工具,涵盖代码编写到战略分析等场景。然而,该模型内置了保护机制,防止其被用于漏洞检测或危险物质的生成。若尝试绕过限制,系统将自动切换至功能较弱的版本——Claude Opus 4.8。
Mythos 5 则专为软件漏洞检测而设计,其能力与 Fable 5 相同,但不设保护限制。仅有经过验证的网络安全专家才能获得访问权限,以降低滥用风险。Anthropic 强调,此举旨在加速修复漏洞,防止其被恶意利用。
开发者在模型中集成了分类器系统,用于分析用户请求。除了阻止黑客攻击场景,分类器还能防止合成危险化学或生物化合物,或提取数据以创建失控的 AI 副本。
常见问题
- Claude Fable 5 和 Mythos 5 有何区别?
- Fable 5 是面向公众的通用模型,具备广泛的分析能力,但内置防黑客攻击保护。Mythos 5 功能相同,但无限制,仅向可信的网络安全专家开放。
- Anthropic 为何限制 Mythos 5 的访问权限?
- 该模型能发现软件中的关键漏洞,若被恶意利用将带来风险。限制访问可降低其被用于网络攻击的可能性。
- Fable 5 采取了哪些安全措施?
- 模型配备了分类器,可阻止漏洞搜索、危险物质合成或提取内部数据以复制无保护机制的 AI 等行为。
分享:
Dzen 订阅: /feed/dzen.xml · RSS: /feed.xml