V-HelpPremium IT service for your business
← All news
Artificial intelligence

Researchers Automate LLM Reasoning Strategy Design, Cutting Token Usage by 69.5%

Researchers Automate LLM Reasoning Strategy Design, Cutting Token Usage by 69.5%

Photo: VentureBeat

Quick answer

AutoTTS от Meta и Google автоматизирует проектирование стратегий рассуждения LLM, сокращая потребление токенов на 69,5% без потери точности.

Test-time scaling (TTS) is a method that enhances the performance of large language models (LLMs) by leveraging additional computational resources during inference. However, TTS strategies have traditionally been designed manually, limiting their efficiency and requiring significant time investment from engineers. The new AutoTTS framework automates this process, transforming strategy design into an algorithmic search task.

At the core of AutoTTS is the idea of delegating strategy design to a specialized LLM agent, such as Claude Code. The agent operates within a predefined environment, where search boundaries, optimization goals (balancing accuracy and cost), and feedback mechanisms are established. Instead of manually creating branching rules or pruning unpromising reasoning paths, the agent independently tests and refines controllers—algorithms that manage computational resource allocation.

A key advantage of AutoTTS is its use of an offline environment for strategy testing. Rather than repeatedly running the base model to generate tokens, the agent analyzes pre-collected reasoning trajectories with intermediate signals. This significantly reduces the cost of finding the optimal strategy: the entire process took 160 minutes and cost $39.90. The result was the Confidence Momentum Controller, which employs non-obvious mechanisms such as tracking confidence trends instead of instantaneous values and dynamically distributing resources across reasoning branches.

During testing on models like Qwen3 (ranging from 0.6B to 8B parameters) and DeepSeek-R1, AutoTTS demonstrated impressive results. In resource-saving mode, the framework reduced token consumption by 69.5% compared to the baseline Self-Consistency method while maintaining accuracy. In high-budget mode, AutoTTS outperformed all manual strategies in five out of eight tests. On the GPQA-Diamond benchmark, token usage was reduced from 510K to 151K with a slight increase in accuracy. The solution is already available on GitHub and can serve as a ready-to-use replacement for existing TTS controllers.

Common questions

Что такое AutoTTS и как он работает?
AutoTTS — это фреймворк от Meta и Google, который автоматически находит оптимальные стратегии тестового масштабирования (TTS) для LLM. Он использует LLM-агентов (например, Claude Code) для алгоритмического поиска контроллеров, управляющих распределением вычислительных ресурсов во время инференса.
Какие преимущества даёт AutoTTS по сравнению с ручными стратегиями?
AutoTTS сокращает потребление токенов на 69,5% без снижения точности, а в некоторых случаях даже повышает производительность моделей. Он автоматизирует проектирование стратегий, устраняя необходимость ручной настройки эвристик и экономя время и ресурсы.
Как AutoTTS сокращает затраты на поиск оптимальной стратегии?
AutoTTS использует офлайн-среду для тестирования стратегий, анализируя заранее собранные траектории рассуждений. Это позволяет сократить затраты на поиск: весь процесс занял 160 минут и обошёлся в $39,90.
Какие модели поддерживает AutoTTS?
AutoTTS протестирован на моделях Qwen3 (от 0,6B до 8B параметров) и DeepSeek-R1. Он доступен на GitHub и может использоваться как замена существующим контроллерам TTS.
Share:

Dzen feed: /feed/dzen.xml · RSS: /feed.xml

Why trust this

Prepared by the V-Help editorial team from the primary source with a published date.

Published by: V-Help.ru news desk

Source: VentureBeat