Cohere выпустила открытую модель для разработки North Mini Code на одной GPU H100

Фото: VentureBeat
Краткий ответ
Cohere выпустила открытую модель North Mini Code для агентной разработки ПО, работающую на одной GPU H100. Модель поддерживает 256K токенов контекста, обучена на 70K задачах и превосходит аналоги по скорости генерации,…
Компания Cohere представила открытую модель North Mini Code, предназначенную для автоматизации процессов разработки ПО. Модель оптимизирована для работы на одной видеокарте NVIDIA H100 и поддерживает контекст до 256 000 токенов, что позволяет анализировать крупные проекты в одном проходе. Решение доступно под лицензией Apache 2.0 и уже размещено на платформе Hugging Face.
North Mini Code — это модель с архитектурой mixture-of-experts (MoE) на 30 миллиардов параметров, из которых активно используются лишь 3 миллиарда на токен. Это снижает требования к вычислительным ресурсам при инференсе. Модель обучена на более чем 70 000 верифицируемых задачах из 5 000 репозиториев, что обеспечивает высокую точность в агентных сценариях разработки, таких как ревью кода, анализ архитектуры и взаимодействие с терминалом.
В независимых тестах North Mini Code продемонстрировала высокую скорость генерации — до 210 токенов в секунду, что ставит её в топ-10 среди открытых моделей. Однако эксперты отмечают, что модель генерирует в три раза больше токенов, чем аналоги, что может увеличить затраты на инференс в высоконагруженных пайплайнах. Это делает её более подходящей для локального развёртывания, чем для облачных решений с оплатой за токен, таких как Claude Fable 5* или GitHub Copilot*.
Основатель Cohere Ник Фрост подчеркнул, что North Mini Code — это альтернатива проприетарным моделям, предлагающая прозрачность и контроль над данными. Модель уже поддерживает работу на локальных устройствах, включая Mac Studio, что делает её привлекательной для команд, заинтересованных в суверенитете данных и снижении зависимости от облачных сервисов.
Частые вопросы
- Чем North Mini Code отличается от других моделей для разработки?
- North Mini Code обучена специально для агентных задач разработки, включая работу с терминалом и анализ архитектуры, а не адаптирована из универсальных моделей. Она также поддерживает локальное развёртывание на одной GPU H100.
- Какие задачи может решать North Mini Code?
- Модель способна выполнять ревью кода, анализировать зависимости в проектах, взаимодействовать с командной строкой и генерировать код в рамках агентных пайплайнов разработки.
- Какие ограничения есть у North Mini Code?
- Основной недостаток — высокая «многословность»: модель генерирует в три раза больше токенов, чем аналоги, что увеличивает затраты на инференс в промышленных сценариях.
Лента для Дзен: /feed/dzen.xml · RSS: /feed.xml