Что такое MiniMax Sparse Attention (MSA) и как он работает?

MSA — это новый механизм разреженного внимания от MiniMax, который оптимизирует вычисления при обработке длинных контекстов. Он устраняет недостатки субквадратичных методов, сохраняя точность полного внимания, но при этом значительно снижая вычислительные затраты.

Какие преимущества даёт M3 для ИИ-агентов?

M3 позволяет развёртывать ИИ-агентов с экстремально длинными контекстами, что ранее было ограничено аппаратными ограничениями. Это делает экономически целесообразным использование агентов для работы с объёмными документами и сложными задачами.

← Все новости

Искусственный интеллект

MiniMax представит M3 с революционным механизмом разреженного внимания

28 мая 2026 г.

Фото: VentureBeat

Краткий ответ

MiniMax анонсировала модель M3 с революционным механизмом MiniMax Sparse Attention (MSA), ускоряющим обработку длинных контекстов в 15,6 раза.

Китайская компания MiniMax, известная своими передовыми разработками в области искусственного интеллекта, анонсировала новую модель M3, которая станет следующим шагом в эволюции её линейки языковых моделей. Главное нововведение — механизм MiniMax Sparse Attention (MSA), позволяющий значительно ускорить обработку длинных контекстов без потери точности.

В отличие от предыдущей модели M2, где использовалось полное внимание с квадратичной сложностью, M3 внедряет разреженную архитектуру, оптимизирующую вычисления. Это решение устраняет ключевые недостатки субквадратичных методов, таких как потеря контекста и снижение точности при многошаговом рассуждении. По предварительным данным, MSA обеспечивает 9,7-кратное ускорение на этапе предобработки и 15,6-кратное — на этапе генерации ответов при работе с последовательностями до миллиона токенов.

Разработчики MiniMax подчеркнули, что MSA сохраняет преимущества полного внимания, но при этом избегает его основного недостатка — экспоненциального роста вычислительных затрат. Это открывает новые возможности для развёртывания ИИ-агентов, способных эффективно работать с объёмными документами и сложными задачами. Модель M3 также поддерживает динамический выбор блоков ключей и значений, что решает проблемы кэширования и повышает общую производительность.

Ранее MiniMax уже продемонстрировала высокие результаты с моделями серии M2, которые занимали лидирующие позиции в бенчмарках среди открытых ИИ-решений. Новая архитектура M3 может стать важным шагом на пути к созданию автономных агентов, способных самостоятельно решать сложные задачи, включая разработку и оптимизацию собственного кода.

Частые вопросы

Что такое MiniMax Sparse Attention (MSA) и как он работает?: MSA — это новый механизм разреженного внимания от MiniMax, который оптимизирует вычисления при обработке длинных контекстов. Он устраняет недостатки субквадратичных методов, сохраняя точность полного внимания, но при этом значительно снижая вычислительные затраты.
Насколько быстрее работает модель M3 по сравнению с M2?: По предварительным данным, M3 обеспечивает 9,7-кратное ускорение на этапе предобработки и 15,6-кратное — на этапе генерации ответов при работе с последовательностями до миллиона токенов.
Какие преимущества даёт M3 для ИИ-агентов?: M3 позволяет развёртывать ИИ-агентов с экстремально длинными контекстами, что ранее было ограничено аппаратными ограничениями. Это делает экономически целесообразным использование агентов для работы с объёмными документами и сложными задачами.
Поддерживает ли M3 динамический выбор блоков ключей и значений?: Да, модель M3 поддерживает динамический выбор блоков ключей и значений, что решает проблемы кэширования и повышает общую производительность.

Лента для Дзен: /feed/dzen.xml · RSS: /feed.xml