Google Releases Local Multimodal Gemma 4 12B Model for Business

Photo: VentureBeat
Quick answer
Компания Google выпустила новую версию открытой модели искусственного интеллекта Gemma 4 12B, которая способна обрабатывать аудио и видео без подключения к облаку. Модель оптимизирована для работы на стандартных корпоративных ноутбуках с 16 ГБ оперативной памяти и поддерживает мультимодальные задачи без дополнительных задержек. Решение подходит для предприятий, где важна конфиденциальность данных и автономность работы. Инновационная архитектура позволяет обойтись без отдельных энкодеров, что снижает требования к ресурсам и ускоряет обработку данных.
Google has introduced the open-source AI model Gemma 4 12B, which supports multimodal data processing and operates efficiently on resource-constrained devices. With 11.95 billion parameters and an Apache 2.0 license, the model is optimized to run on laptops with 16GB of VRAM or unified memory, enabling enterprises to leverage AI offline—such as during travel or for handling sensitive data without risking leaks.
A key innovation in Gemma 4 12B is its encoder-free architecture. Instead of converting audio and video into intermediate representations, the model directly integrates raw data into its core processing mechanism. This reduces latency and memory consumption while simplifying system fine-tuning. For image processing, it employs a 35-million-parameter module, while audio data is handled without additional transformations.
The model supports a context window of up to 256,000 tokens, allowing analysis of lengthy documents, code, or meeting recordings. Its built-in step-by-step reasoning and function-calling capabilities make it suitable for developing autonomous agents. Despite its compact size, Gemma 4 12B delivers performance comparable to larger Google models, unlocking new opportunities for businesses in security-sensitive and high-performance sectors.
Common questions
- Common questions
- Компания Google выпустила новую версию открытой модели искусственного интеллекта Gemma 4 12B, которая способна обрабатывать аудио и видео без подключения к облаку. Модель оптимизирована для работы на стандартных корпоративных ноутбуках с 16 ГБ оперативной памяти и поддерживает мультимодальные задачи без дополнительных задержек. Решение подходит для предприятий, где важна конфиденциальность данных и автономность работы. Инновационная архитектура позволяет обойтись без отдельных энкодеров, что снижает требования к ресурсам и ускоряет обработку данных.
Dzen feed: /feed/dzen.xml · RSS: /feed.xml