Anthropic представила Opus 4.8: снижение ошибок выравнивания на уровне Mythos Preview

Фото: ZDNet
Краткий ответ
Anthropic выпустила флагманскую модель Opus 4.8 с на 33% дешевле, быстрее и с меньшими ошибками выравнивания, приближаясь к Mythos Preview. Улучшены результаты в программировании, но уступает GPT-5.5 от OpenAI.
Anthropic выпустила обновление своей флагманской модели искусственного интеллекта — Opus 4.8, которая заменит предыдущую версию 4.7. Новая модель предлагает более высокую скорость работы при снижении стоимости на 33%. Основной акцент в релизе сделан на улучшении безопасности и надёжности: компания заявила о «существенном» снижении уровня ошибок выравнивания (misalignment) по сравнению с Opus 4.7, приблизившись к показателям закрытой модели Mythos Preview.
Opus 4.8 также показала улучшенные результаты в тестах на программирование, превзойдя предшественницу, но не достигнув уровня GPT-5.5 от OpenAI. Разработчики подчеркнули, что модель стала более «просоциальной» — например, лучше поддерживает автономию пользователя и действует в его интересах, хотя конкретные критерии таких улучшений остаются неясными.
Anthropic традиционно уделяет особое внимание безопасности своих моделей. В предыдущей версии Opus 4.7 честность достигала 92%, а уровень галлюцинаций и склонности к лести был снижен. Новая версия продолжает эту тенденцию, устанавливая более высокие стандарты для индустрии. Сравнение с Mythos Preview, которая считается одной из самых безопасных моделей, подчёркивает амбиции компании в этой области.
Модель уже доступна пользователям по той же цене, что и предыдущая версия, что делает её привлекательным выбором для бизнеса и разработчиков, ориентированных на надёжность и безопасность ИИ-решений.
Частые вопросы
- Что нового в модели Opus 4.8 от Anthropic?
- Opus 4.8 отличается повышенной скоростью, снижением стоимости на 33%, существенно меньшим уровнем ошибок выравнивания (misalignment) и улучшенными результатами в бенчмарках по программированию.
- Как Opus 4.8 сравнивается с Mythos Preview?
- Opus 4.8 приближается по уровню ошибок выравнивания к закрытой модели Mythos Preview, считающейся одной из самых безопасных в индустрии.
- Улучшила ли Opus 4.8 результаты в программировании?
- Да, Opus 4.8 показала улучшенные результаты в тестах на программирование по сравнению с предыдущей версией, но не превзошла GPT-5.5 от OpenAI.
- Какие преимущества даёт Opus 4.8 для бизнеса?
- Opus 4.8 предлагает более высокую скорость, снижение стоимости на 33%, повышенную безопасность и надёжность, что делает её привлекательным выбором для бизнеса.
Лента для Дзен: /feed/dzen.xml · RSS: /feed.xml