Стартап Subquadratic заявил о прорыве в производительности LLM

Фото: MIT Technology Review
Краткий ответ
Стартап Subquadratic разработал модель SubQ, которая обещает в 12 раз увеличить объём обрабатываемого текста, снизить энергопотребление и сохранить качество на уровне лидеров рынка.
Американский стартап Subquadratic представил новую языковую модель SubQ, которая, по его словам, способна совершить прорыв в индустрии больших языковых моделей (LLM). Компания утверждает, что SubQ обрабатывает до 12 раз больше текста за один раз, чем аналогичные модели от Google DeepMind, OpenAI и Anthropic, при этом демонстрируя сопоставимое качество на ключевых задачах, таких как генерация кода.
Однако первоначальные заявления Subquadratic были встречены скептически. Критики отмечали отсутствие независимых проверок и сравнивали ситуацию с громким провалом Theranos в сфере медицинских технологий. В ответ на критику стартап опубликовал результаты дополнительных тестов, проведённых независимой компанией Appen, которые частично подтвердили эффективность SubQ.
По словам директора по исследованиям генеративного ИИ в Appen, Жанин Синанан-Сингх, результаты тестов стали неожиданностью: «Это может стать переломным моментом, так как существующие модели страдают от проблем со скоростью и неэффективностью». Тем не менее, SubQ пока не доступна для широкого тестирования, что оставляет вопросы о её реальных возможностях.
Соучредитель и технический директор Subquadratic Алекс Уидон признал, что компания могла бы избежать части скепсиса, если бы сразу предоставила независимые данные. «В будущем мы будем тщательнее проверять результаты перед публикацией», — заявил он.
Частые вопросы
- Что такое SubQ и чем она отличается от других LLM?
- SubQ — это новая языковая модель от стартапа Subquadratic, которая, по заявлениям компании, обрабатывает в 12 раз больше текста за один раз, быстрее и энергоэффективнее аналогов. Она также сопоставима по качеству с моделями Google DeepMind и OpenAI.
- Почему к заявлениям Subquadratic отнеслись скептически?
- Первоначально компания не предоставила достаточных доказательств своих утверждений, ограничившись собственными тестами. Это вызвало сравнения с громкими провалами вроде Theranos, пока независимые тесты не подтвердили часть заявлений.
- Какие задачи может решать SubQ?
- Модель предназначена для обработки больших объёмов данных, включая анализ сотен документов или целых кодовых баз. Она также подходит для задач, требующих высокой скорости и эффективности.
Лента для Дзен: /feed/dzen.xml · RSS: /feed.xml