Исследователи автоматизировали проектирование стратегий рассуждения LLM и сократили потребление токенов на 69,5%

Фото: VentureBeat
Краткий ответ
AutoTTS от Meta и Google автоматизирует проектирование стратегий рассуждения LLM, сокращая потребление токенов на 69,5% без потери точности.
Тестовое масштабирование (TTS) — метод, который улучшает качество работы больших языковых моделей (LLM) за счёт дополнительных вычислительных ресурсов на этапе инференса. Однако до сих пор стратегии TTS разрабатывались вручную, что ограничивало их эффективность и требовало значительных временных затрат от инженеров. Новый фреймворк AutoTTS автоматизирует этот процесс, превращая проектирование стратегий в задачу алгоритмического поиска.
В основе AutoTTS лежит идея передачи роли проектировщика стратегий специализированной LLM-агенту, такому как Claude Code. Агент действует в заранее заданной среде, где определены границы поиска, цели оптимизации (баланс точности и затрат) и механизмы обратной связи. Вместо ручного создания правил ветвления или обрезки неперспективных путей рассуждения, агент самостоятельно тестирует и дорабатывает контроллеры — алгоритмы, управляющие распределением вычислительных ресурсов.
Ключевое преимущество AutoTTS — использование офлайн-среды для тестирования стратегий. Вместо многократного запуска базовой модели для генерации токенов, агент анализирует заранее собранные траектории рассуждений с промежуточными сигналами. Это позволяет значительно сократить затраты на поиск оптимальной стратегии: весь процесс занял 160 минут и обошёлся в $39,90. В результате был создан контроллер Confidence Momentum Controller, который использует неочевидные механизмы, такие как отслеживание трендов доверия вместо мгновенных значений и динамическое распределение ресурсов между ветвями рассуждений.
В ходе тестирования на моделях Qwen3 (от 0,6B до 8B параметров) и DeepSeek-R1 AutoTTS продемонстрировал впечатляющие результаты. В режиме экономии ресурсов фреймворк сократил потребление токенов на 69,5% по сравнению с базовым методом Self-Consistency, сохранив при этом точность. В режиме повышенного бюджета AutoTTS превзошёл все ручные стратегии в пяти из восьми тестов. На бенчмарке GPQA-Diamond удалось снизить расход токенов с 510K до 151K при незначительном росте точности. Решение уже доступно на GitHub и может использоваться как готовая замена существующим контроллерам TTS.
* Facebook, Instagram, WhatsApp и другие сервисы Meta — принадлежат компании Meta Platforms Inc., деятельность которой признана экстремистской и запрещена на территории Российской Федерации.
Частые вопросы
- Что такое AutoTTS и как он работает?
- AutoTTS — это фреймворк от Meta и Google, который автоматически находит оптимальные стратегии тестового масштабирования (TTS) для LLM. Он использует LLM-агентов (например, Claude Code) для алгоритмического поиска контроллеров, управляющих распределением вычислительных ресурсов во время инференса.
- Какие преимущества даёт AutoTTS по сравнению с ручными стратегиями?
- AutoTTS сокращает потребление токенов на 69,5% без снижения точности, а в некоторых случаях даже повышает производительность моделей. Он автоматизирует проектирование стратегий, устраняя необходимость ручной настройки эвристик и экономя время и ресурсы.
- Как AutoTTS сокращает затраты на поиск оптимальной стратегии?
- AutoTTS использует офлайн-среду для тестирования стратегий, анализируя заранее собранные траектории рассуждений. Это позволяет сократить затраты на поиск: весь процесс занял 160 минут и обошёлся в $39,90.
- Какие модели поддерживает AutoTTS?
- AutoTTS протестирован на моделях Qwen3 (от 0,6B до 8B параметров) и DeepSeek-R1. Он доступен на GitHub и может использоваться как замена существующим контроллерам TTS.
Лента для Дзен: /feed/dzen.xml · RSS: /feed.xml