Anthropic 发布 Opus 4.8:对齐错误率降至 Mythos Preview 水平

图片: ZDNet
简要回答
Anthropic выпустила флагманскую модель Opus 4.8 с на 33% дешевле, быстрее и с меньшими ошибками выравнивания, приближаясь к Mythos Preview. Улучшены результаты в программировании, но уступает GPT-5.5 от OpenAI.
Anthropic 发布了其旗舰 AI 模型的更新版本——Opus 4.8,取代之前的 4.7 版本。新模型在运行速度提升的同时,成本降低了 33%。此次更新的重点是提高安全性和可靠性:公司宣布与 Opus 4.7 相比,「显著」降低了对齐错误率(misalignment),接近闭源模型 Mythos Preview 的水平。
Opus 4.8 在编程测试中表现更佳,超越了前代产品,但仍未达到 OpenAI GPT-5.5 的水平。开发者强调,该模型变得更加「亲社会」——例如更好地支持用户自主性并维护其利益,但具体改进标准尚不明确。
Anthropic 一直高度重视模型安全性。上一版本 Opus 4.7 的诚实度达 92%,并减少了幻觉和奉承倾向。新版本延续了这一趋势,为行业树立了更高标准。与被视为最安全模型之一的 Mythos Preview 对比,凸显了公司在该领域的雄心。
新模型现已向用户开放,价格与前代版本相同,成为注重 AI 解决方案可靠性和安全性的企业及开发者的理想选择。
常见问题
- Что нового в модели Opus 4.8 от Anthropic?
- Opus 4.8 отличается повышенной скоростью, снижением стоимости на 33%, существенно меньшим уровнем ошибок выравнивания (misalignment) и улучшенными результатами в бенчмарках по программированию.
- Как Opus 4.8 сравнивается с Mythos Preview?
- Opus 4.8 приближается по уровню ошибок выравнивания к закрытой модели Mythos Preview, считающейся одной из самых безопасных в индустрии.
- Улучшила ли Opus 4.8 результаты в программировании?
- Да, Opus 4.8 показала улучшенные результаты в тестах на программирование по сравнению с предыдущей версией, но не превзошла GPT-5.5 от OpenAI.
- Какие преимущества даёт Opus 4.8 для бизнеса?
- Opus 4.8 предлагает более высокую скорость, снижение стоимости на 33%, повышенную безопасность и надёжность, что делает её привлекательным выбором для бизнеса.
分享:
Dzen 订阅: /feed/dzen.xml · RSS: /feed.xml