V-HelpМы – сервис высокого уровня
← Все новости
Искусственный интеллект

Исследователи автоматизировали проектирование стратегий рассуждения LLM и сократили потребление токенов на 69,5%

Исследователи автоматизировали проектирование стратегий рассуждения LLM и сократили потребление токенов на 69,5%

Фото: VentureBeat

Краткий ответ

AutoTTS от Meta и Google автоматизирует проектирование стратегий рассуждения LLM, сокращая потребление токенов на 69,5% без потери точности.

Тестовое масштабирование (TTS) — метод, который улучшает качество работы больших языковых моделей (LLM) за счёт дополнительных вычислительных ресурсов на этапе инференса. Однако до сих пор стратегии TTS разрабатывались вручную, что ограничивало их эффективность и требовало значительных временных затрат от инженеров. Новый фреймворк AutoTTS автоматизирует этот процесс, превращая проектирование стратегий в задачу алгоритмического поиска.

В основе AutoTTS лежит идея передачи роли проектировщика стратегий специализированной LLM-агенту, такому как Claude Code. Агент действует в заранее заданной среде, где определены границы поиска, цели оптимизации (баланс точности и затрат) и механизмы обратной связи. Вместо ручного создания правил ветвления или обрезки неперспективных путей рассуждения, агент самостоятельно тестирует и дорабатывает контроллеры — алгоритмы, управляющие распределением вычислительных ресурсов.

Ключевое преимущество AutoTTS — использование офлайн-среды для тестирования стратегий. Вместо многократного запуска базовой модели для генерации токенов, агент анализирует заранее собранные траектории рассуждений с промежуточными сигналами. Это позволяет значительно сократить затраты на поиск оптимальной стратегии: весь процесс занял 160 минут и обошёлся в $39,90. В результате был создан контроллер Confidence Momentum Controller, который использует неочевидные механизмы, такие как отслеживание трендов доверия вместо мгновенных значений и динамическое распределение ресурсов между ветвями рассуждений.

В ходе тестирования на моделях Qwen3 (от 0,6B до 8B параметров) и DeepSeek-R1 AutoTTS продемонстрировал впечатляющие результаты. В режиме экономии ресурсов фреймворк сократил потребление токенов на 69,5% по сравнению с базовым методом Self-Consistency, сохранив при этом точность. В режиме повышенного бюджета AutoTTS превзошёл все ручные стратегии в пяти из восьми тестов. На бенчмарке GPQA-Diamond удалось снизить расход токенов с 510K до 151K при незначительном росте точности. Решение уже доступно на GitHub и может использоваться как готовая замена существующим контроллерам TTS.

* Facebook, Instagram, WhatsApp и другие сервисы Meta — принадлежат компании Meta Platforms Inc., деятельность которой признана экстремистской и запрещена на территории Российской Федерации.

Частые вопросы

Что такое AutoTTS и как он работает?
AutoTTS — это фреймворк от Meta и Google, который автоматически находит оптимальные стратегии тестового масштабирования (TTS) для LLM. Он использует LLM-агентов (например, Claude Code) для алгоритмического поиска контроллеров, управляющих распределением вычислительных ресурсов во время инференса.
Какие преимущества даёт AutoTTS по сравнению с ручными стратегиями?
AutoTTS сокращает потребление токенов на 69,5% без снижения точности, а в некоторых случаях даже повышает производительность моделей. Он автоматизирует проектирование стратегий, устраняя необходимость ручной настройки эвристик и экономя время и ресурсы.
Как AutoTTS сокращает затраты на поиск оптимальной стратегии?
AutoTTS использует офлайн-среду для тестирования стратегий, анализируя заранее собранные траектории рассуждений. Это позволяет сократить затраты на поиск: весь процесс занял 160 минут и обошёлся в $39,90.
Какие модели поддерживает AutoTTS?
AutoTTS протестирован на моделях Qwen3 (от 0,6B до 8B параметров) и DeepSeek-R1. Он доступен на GitHub и может использоваться как замена существующим контроллерам TTS.
Поделиться:

Лента для Дзен: /feed/dzen.xml · RSS: /feed.xml

Почему этому можно верить

Материал подготовлен редакцией V-Help на основе первоисточника с указанием даты публикации.

Публикация: Новостной отдел V-Help.ru

Источник материала: VentureBeat