Alibaba представила серию Qwen-Robot: три базовые модели для робототехники

Фото: TechNode
Краткий ответ
Alibaba выпустила серию Qwen-Robot с тремя моделями для робототехники: Qwen-RobotNav (навигация), Qwen-RobotManip (манипуляции) и Qwen-RobotWorld (прогнозирование состояний).
Компания Alibaba представила новую серию моделей Qwen-Robot, предназначенных для интеграции языковых команд и физических действий в робототехнике. В линейку вошли три базовые модели: Qwen-RobotNav, Qwen-RobotManip и Qwen-RobotWorld, каждая из которых решает специфические задачи.
Qwen-RobotNav фокусируется на мобильной робототехнике, объединяя возможности компьютерного зрения и обработки языка. Модель поддерживает четыре ключевые функции: выполнение инструкций, навигацию к цели, отслеживание объектов и автономное вождение. Это позволяет роботам эффективно взаимодействовать с окружающей средой.
Qwen-RobotManip стандартизирует пространство состояний и действий, представляя движения манипуляторов в координатах камеры. Модель обучена на огромном массиве данных — более 38 100 часов открытых источников. Это обеспечивает возможность масштабного обучения на различных платформах и расширяет спектр манипулятивных задач.
Третья модель, Qwen-RobotWorld, выступает в роли универсального «мирового» решения. Она связывает понимание языка и визуальной информации с прогнозированием будущих состояний. Модель способна предсказывать физически согласованные сценарии в навигации, вождении и манипуляциях, что делает её применимой для широкого круга задач в области робототехники.
Частые вопросы
- Какие задачи решают модели серии Qwen-Robot?
- Модели Qwen-Robot охватывают навигацию, манипуляции с объектами и прогнозирование будущих состояний. Они объединяют языковое понимание с физическими действиями роботов, обеспечивая универсальность в разных сценариях.
- На каких данных обучалась модель Qwen-RobotManip?
- Qwen-RobotManip обучалась на более чем 38 100 часах открытых данных. Это позволяет модели поддерживать крупномасштабное обучение на различных платформах робототехники.
- Чем отличается Qwen-RobotWorld от других моделей серии?
- Qwen-RobotWorld — это универсальная модель, прогнозирующая будущие состояния в навигации, вождении и манипуляциях. Она связывает понимание языка и визуальной информации с предсказанием физически согласованных сценариев.
Лента для Дзен: /feed/dzen.xml · RSS: /feed.xml