Ошибки Google AI: почему нейросеть не может правильно написать слово «Google»

Фото: TechCrunch
Краткий ответ
Google AI ошибается в написании простых слов, включая название компании. Нейросеть не распознаёт количество букв и допускает ошибки в базовой грамотности, что связано с архитектурой LLM.
Интеграция генеративного ИИ в поисковую систему Google выявила серьёзные пробелы в работе нейросетей. Несмотря на способность решать сложные задачи — от написания кода до математических вычислений — модели на базе LLM (Large Language Models) демонстрируют детский уровень грамотности. В частности, алгоритм ошибочно определил количество букв в словах «poop» и «Trump», а также исказил написание термина «journalism».
Представители Google признали проблему, отметив, что подсчёт символов в словах остаётся известной уязвимостью языковых моделей. Однако эксперты сомневаются в возможности её быстрого устранения. Дело в том, что LLM не воспринимают текст как последовательность букв. Вместо этого они разбивают информацию на токены — фрагменты, которые могут соответствовать словам, слогам или даже отдельным символам. Затем эти токены преобразуются в числовые векторы, на основе которых модель генерирует ответы.
Исследователи из Университета Альберты и Северо-Восточного университета подчёркивают: архитектура трансформеров, лежащая в основе современных нейросетей, не предполагает понимания структуры слов. Даже если создать идеальный словарь токенов, модели всё равно будут «дробить» текст на более мелкие части для оптимизации обработки. При этом ошибки в написании не мешают ИИ выполнять сложные задачи, но напоминают пользователям о необходимости проверять результаты работы алгоритмов.
Ранее Google уже сталкивался с репутационными рисками из-за ИИ. Например, поисковая выдача предлагала пользователям добавлять клей на пиццу или есть камни, ссылаясь на сатирические источники. Новые ошибки лишь усиливают скепсис в отношении безоговорочного доверия к автоматизированным системам, даже если они разработаны технологическими гигантами.
Частые вопросы
- Почему Google AI не может правильно написать слово «Google»?
- Google AI использует архитектуру LLM, которая обрабатывает текст как набор токенов (фрагментов слов или символов), а не как последовательность букв. Это приводит к ошибкам в подсчёте символов и написании простых слов.
- Какие ещё ошибки допускает Google AI в написании слов?
- Нейросеть ошибается в словах «poop», «Trump», «journalism» (дополнительная «d»), а также искажает количество букв в простых терминах. Ошибки связаны с неспособностью LLM анализировать текст на уровне отдельных символов.
- Можно ли быстро исправить ошибки Google AI в грамотности?
- Эксперты считают проблему фундаментальной из-за архитектуры трансформеров. Даже идеальный словарь токенов не решит задачу, так как модели оптимизированы для дробления текста на мелкие части, а не для анализа структуры слов.
- Как Google комментирует ошибки в работе AI?
- Представители Google признают проблему, отмечая, что подсчёт символов остаётся известной уязвимостью языковых моделей. Однако быстрого решения не ожидается из-за особенностей работы LLM.
Лента для Дзен: /feed/dzen.xml · RSS: /feed.xml