Google Omni: революция в создании видео с помощью ИИ и новые вызовы

Фото: ZDNet
Google представила новый инструмент на базе искусственного интеллекта — Gemini Omni, который выводит генерацию видео на принципиально новый уровень. Компания сравнивает прорыв с эффектом от запуска Nano Banana в области создания изображений, но теперь речь идет о видео. Omni интегрируется в экосистему Google, включая приложение Gemini, Google Flow и YouTube Shorts, и позволяет комбинировать различные типы данных для генерации контента.
Одной из ключевых функций Omni стала возможность создания цифровых аватаров, которые могут воспроизводить голос и внешность пользователя. Это открывает перспективы для автоматизации производства видеоконтента, но одновременно вызывает опасения по поводу подделок и злоупотреблений. Google внедряет технологию SynthID для маркировки ИИ-контента, однако вопрос доверия к таким материалам остается открытым. Разработчики подчеркивают, что работают над ответственным внедрением функций редактирования аудио и речи.
Инструмент также отличается продвинутой физической моделью, которая учитывает гравитацию, кинетическую энергию и динамику жидкостей. Это позволяет генерировать реалистичные сцены даже на основе коротких текстовых запросов. Omni способен создавать обучающие ролики, объясняющие сложные концепции, что может стать ценным инструментом для маркетологов и технических специалистов. Кроме того, технология поддерживает «разговорное» редактирование видео с помощью естественного языка, что упрощает процесс монтажа.
Пока неясно, какие форматы и разрешения видео будет поддерживать Omni, и сможет ли инструмент конкурировать с профессиональными редакторами вроде Final Cut или Premiere Pro. Google планирует предоставить доступ к API для корпоративных клиентов и разработчиков, что может расширить сферу применения технологии. Однако остаются вопросы о лицензировании, удалении водяных знаков и интеграции с существующими рабочими процессами в индустрии.
Лента для Дзен: /feed/dzen.xml · RSS: /feed.xml