Anthropic временно отключает модель Claude Fable 5 по требованию властей США

Фото: Wired
Краткий ответ
Компания Anthropic отключила ИИ-модель Claude Fable 5 после обнаружения метода обхода встроенных ограничений безопасности. Решение принято по требованию властей США для предотвращения потенциальных злоупотреблений.
Компания Anthropic, разработчик передовых моделей искусственного интеллекта, объявила о временном отключении доступа к своей системе Claude Fable 5. Решение принято после того, как власти США выявили метод обхода встроенных ограничений безопасности, известный как «джейлбрейк».
В официальном блоге компании отмечается, что обнаруженная уязвимость могла позволить злоумышленникам обойти защитные механизмы модели, что создавало потенциальные риски для пользователей. Anthropic подчеркнула, что действует в соответствии с требованиями регуляторов и уже работает над устранением проблемы.
Подробности о характере уязвимости и сроках восстановления доступа не раскрываются. Эксперты отмечают, что подобные инциденты становятся все более частыми по мере роста сложности ИИ-систем и их интеграции в критически важные процессы.
Anthropic — один из ключевых игроков на рынке генеративного ИИ, конкурирующий с такими компаниями, как OpenAI и Google. Модель Claude используется в корпоративных и исследовательских проектах, что делает вопросы безопасности особенно актуальными.
Частые вопросы
- Что такое «джейлбрейк» в контексте ИИ-моделей?
- Джейлбрейк — это метод обхода встроенных ограничений и фильтров ИИ-системы, позволяющий заставить модель выполнять запрещенные или небезопасные действия. Такие уязвимости могут использоваться для генерации вредоносного контента или нарушения политик безопасности.
- Почему Anthropic отключила Claude Fable 5?
- Компания выполнила требование властей США после обнаружения уязвимости, которая могла быть использована для обхода защитных механизмов модели. Отключение направлено на предотвращение потенциальных рисков до устранения проблемы.
- Когда модель Claude Fable 5 вернется в работу?
- Anthropic не раскрывает точные сроки восстановления доступа. В официальном сообщении указано, что работа над исправлением уязвимости уже ведется, но детали не уточняются.
Лента для Дзен: /feed/dzen.xml · RSS: /feed.xml