HPE и AMD предлагают вернуться к собственным дата-центрам для снижения затрат на AI

Фото: ITmedia
Краткий ответ
HPE и AMD предлагают перенести вычисления для AI в корпоративные дата-центры, чтобы снизить затраты на токены и уменьшить зависимость от внешних моделей.
На фоне стремительного распространения AI-агентов компании сталкиваются с проблемой резкого роста затрат на обработку токенов. Технический директор HPE Антонио Руссо на ежегодном мероприятии компании отметил, что зависимость от внешних моделей для генеративного AI приводит к скрытым расходам, которые сложно прогнозировать и контролировать.
В качестве решения HPE и AMD предлагают стратегию возвращения вычислений для машинного обучения в корпоративные дата-центры. Это позволит компаниям не только снизить затраты на токены, но и сохранить полный контроль над инфраструктурой, избегая зависимости от сторонних провайдеров. Пример AMD показывает, как такая стратегия может быть реализована на практике с использованием современных аппаратных решений.
Перенос вычислений в собственные дата-центры также открывает возможности для оптимизации производительности и безопасности. Компании смогут адаптировать инфраструктуру под свои нужды, снижая риски утечек данных и повышая эффективность работы AI-моделей.
Частые вопросы
- Почему компании сталкиваются с ростом затрат на токены в AI?
- Рост затрат связан с увеличением потребления токенов при использовании внешних моделей для генеративного AI. Чем больше AI-агентов внедряется, тем выше расходы на обработку данных.
- Какое решение предлагают HPE и AMD для снижения затрат?
- Компании предлагают перенести вычисления для AI в собственные дата-центры, что позволит контролировать расходы и снизить зависимость от внешних провайдеров.
- Какие преимущества даёт использование корпоративных дата-центров для AI?
- Собственные дата-центры обеспечивают большую гибкость, контроль над инфраструктурой и возможность оптимизации затрат на вычисления и хранение данных.
Лента для Дзен: /feed/dzen.xml · RSS: /feed.xml