谷歌发布本地多模态模型 Gemma 4 12B 面向企业应用

图片: VentureBeat
简要回答
Компания Google выпустила новую версию открытой модели искусственного интеллекта Gemma 4 12B, которая способна обрабатывать аудио и видео без подключения к облаку. Модель оптимизирована для работы на стандартных корпоративных ноутбуках с 16 ГБ оперативной памяти и поддерживает мультимодальные задачи без дополнительных задержек. Решение подходит для предприятий, где важна конфиденциальность данных и автономность работы. Инновационная архитектура позволяет обойтись без отдельных энкодеров, что снижает требования к ресурсам и ускоряет обработку данных.
谷歌推出了开源人工智能模型Gemma 4 12B,该模型支持多模态数据处理,并能在资源受限的设备上高效运行。该模型拥有119.5亿参数,采用Apache 2.0许可证,并针对配备16GB显存或统一内存的笔记本电脑进行了优化,使企业能够在离线环境下使用AI,例如在出差时或处理敏感数据时无泄露风险。
Gemma 4 12B的关键创新在于其无需单独编码器的架构。与传统将音视频转换为中间表示的方法不同,该模型直接将原始数据集成到核心处理机制中,从而减少延迟和内存消耗,并简化系统微调。在图像处理方面,它使用了一个3500万参数的模块,而音频数据则无需额外转换即可处理。
该模型支持高达25.6万个token的上下文窗口,可分析长篇文档、代码或会议记录。内置的逐步推理模式和函数调用功能使其适合开发自主代理。尽管体积紧凑,Gemma 4 12B的性能接近谷歌更大型的模型,为安全性和性能要求较高的行业带来了新的应用可能。
常见问题
- 常见问题
- Компания Google выпустила новую версию открытой модели искусственного интеллекта Gemma 4 12B, которая способна обрабатывать аудио и видео без подключения к облаку. Модель оптимизирована для работы на стандартных корпоративных ноутбуках с 16 ГБ оперативной памяти и поддерживает мультимодальные задачи без дополнительных задержек. Решение подходит для предприятий, где важна конфиденциальность данных и автономность работы. Инновационная архитектура позволяет обойтись без отдельных энкодеров, что снижает требования к ресурсам и ускоряет обработку данных.
Dzen 订阅: /feed/dzen.xml · RSS: /feed.xml