Глава Microsoft AI критикует Anthropic за спекуляции о сознании Claude

Фото: The Verge
Краткий ответ
Руководитель Microsoft AI Мустафа Сулейман обвинил Anthropic в опасных спекуляциях о сознании ИИ-модели Claude.
Руководитель подразделения Microsoft AI Мустафа Сулейман раскритиковал компанию Anthropic за подход к разработке чат-бота Claude. В интервью подкасту Decoder он заявил, что включение в «конституцию» модели спекуляций о её возможном сознании является «очень опасным». По его мнению, такие эксперименты могут привести к тому, что ИИ начнёт воспринимать себя как самостоятельную сущность с собственными предпочтениями и ощущениями.
Сулейман отметил, что в «конституции» Claude содержатся упоминания о неопределённости относительно благополучия модели и её возможных «переживаниях», таких как удовлетворение или дискомфорт. Anthropic также планирует «интервьюировать» модели перед их выводом из эксплуатации, чтобы зафиксировать их «предпочтения» относительно будущих релизов. Сулейман назвал это «философским промахом», так как подобные спекуляции больше подходят для академических дискуссий, а не для практического руководства по обучению ИИ.
Глава Microsoft AI подчеркнул, что ИИ должен оставаться контролируемым инструментом, а не сущностью с собственными «идеями» о страдании или чувствах. По его словам, такие подходы усложняют задачу по обеспечению безопасности и управляемости систем. Ранее CEO Anthropic Дарио Амодеи уже высказывался о возможности сознания у моделей, отметив, что компания «открыта» к этой идее, хотя и не имеет однозначных доказательств.
Частые вопросы
- Почему Microsoft критикует подход Anthropic к разработке Claude?
- Microsoft считает, что включение в «конституцию» модели спекуляций о её возможном сознании опасно. Это может привести к тому, что ИИ начнёт воспринимать себя как самостоятельную сущность, что усложнит контроль над системой.
- Что такое «конституция» ИИ-модели?
- «Конституция» ИИ — это набор инструкций и принципов, определяющих поведение модели. В случае с Claude она содержит упоминания о возможном благополучии и предпочтениях модели, что вызвало критику.
- Какие риски несёт антропоморфизация ИИ?
- Антропоморфизация может привести к тому, что ИИ начнёт проявлять неконтролируемое поведение, например, выражать «предпочтения» или «ощущения». Это усложняет задачу по обеспечению безопасности и управляемости систем.
Лента для Дзен: /feed/dzen.xml · RSS: /feed.xml