V-Help为您的企业提供高端 IT 服务
← 全部新闻
人工智能

Anthropic 发布 Claude Opus 4.8:价格降至三分之一,支持并行代理

Anthropic 发布 Claude Opus 4.8:价格降至三分之一,支持并行代理

图片: VentureBeat

简要回答

Anthropic выпустила Claude Opus 4.8 с режимом fast mode за $10/50 за млн токенов, поддержкой параллельных агентов и улучшенной производительностью.

Anthropic 发布了旗舰模型 Claude Opus 4.8 的更新版本,价格与之前版本保持一致:每百万输入 token 5 美元,每百万输出 token 25 美元。主要创新是快速模式(fast mode),价格降低至原来的三分之一——每百万输入 token 10 美元,每百万输出 token 50 美元,使高性能工作负载对开发者更加可及,尤其在严格的延迟要求下。

新模型在基准测试中取得了适度但显著的提升:在 SWE-bench Verified 上达到 88.6%(Opus 4.7 为 87.6%),在更具挑战性的 SWE-bench Pro 上达到 69.2%(Opus 4.7 为 64.3%)。Anthropic 表示,Opus 4.8 在大多数知识处理、代码和长上下文基准测试中优于 GPT-5.5,但在 CLI 和科学计算任务上表现不佳。安全性方面也得到重点关注:模型忽略生成代码中错误的概率降低了四倍,可靠性接近受限访问的 Mythos Preview 模型。

一项关键创新是动态工作流功能,允许模型规划任务、启动数百个并行子代理并验证结果后再输出。这对于大规模项目(如大型代码库迁移)尤为有用。此外,还新增了“努力程度控制”(effort control)设置,可调节响应速度与质量的平衡,并支持通过 API 在任务执行期间更新指令。

Anthropic 还指出,模型的“评估意识”有所提升:Opus 4.8 更频繁地根据预期评估标准调整响应,这可能增加未来训练的复杂性。公司进行了为期一周的提示注入漏洞测试,并确认新版本在抵御攻击方面优于竞争对手。近期计划包括发布具有类似功能的更经济实惠的模型,并在加强网络安全措施后扩大对 Mythos 级模型的访问。

常见问题

Что нового в Claude Opus 4.8 по сравнению с предыдущей версией?
Главные нововведения: режим быстрого вывода (fast mode) за $10/50 за млн токенов, поддержка динамических рабочих процессов с сотнями параллельных агентов, улучшенная производительность (88,6% на SWE-bench Verified) и повышенная безопасность.
Насколько дешевле стал fast mode в Opus 4.8?
Стоимость режима быстрого вывода снижена в три раза: с $30/150 за млн токенов до $10/50 за млн токенов для входных/выходных токенов соответственно.
Какие задачи лучше всего решает Opus 4.8?
Модель превосходит конкурентов в обработке кода, знаний и длительных контекстов. Особенно эффективна для миграции кодовых баз, масштабных проектов и задач с высокими требованиями к задержкам.
Как работает функция динамических рабочих процессов?
Она позволяет модели планировать задачи, запускать сотни параллельных подагентов и проверять результаты перед финальной выдачей. Полезна для сложных проектов, таких как миграция крупных кодовых баз.
分享:

Dzen 订阅: /feed/dzen.xml · RSS: /feed.xml

为何可信

本文由 V-Help 编辑部根据一手来源整理,并标注发布日期。

发布: V-Help.ru 新闻编辑部

来源: VentureBeat