Pinterest сократил расходы на ИИ на 90% благодаря кастомизации модели

Фото: VentureBeat
Краткий ответ
Pinterest сократил расходы на ИИ на 90%, заменив стандартный vision-слой модели Qwen3-VL собственными эмбеддингами. Это улучшило качество рекомендаций на 30% и ускорило инференс в 20 раз.
Компания Pinterest, обслуживающая более 620 миллионов пользователей ежемесячно, столкнулась с проблемой высоких затрат на использование передовых ИИ-моделей для генерации рекомендаций. Решением стала радикальная переработка архитектуры модели Qwen3-VL: инженеры удалили стандартный vision-слой и интегрировали собственные эмбеддинги, обученные на уникальных данных платформы.
По словам технического директора Мэтта Мэдригала, ключевым фактором успеха стала работа с open-source моделями, которые можно адаптировать под специфические задачи. Команда Pinterest давно использует такие решения — от BERT и CLIP до Qwen3-VL, — но теперь делает упор на глубокую кастомизацию. Например, для шопинг-ассистента Navigator 1 модель была переработана с нуля: вместо стандартного vision-энкодера использовались собственные мультимодальные эмбеддинги, что позволило снизить задержки при инференсе в 20 раз.
Ещё одним нововведением стал «граф вкусов» — динамическая система, отслеживающая предпочтения пользователей в реальном времени. В отличие от социальных графов, она фокусируется не на связях между пользователями, а на их интересах, что помогает переводить стадию вдохновения в конкретные действия, такие как клики по рекламе или покупки. Модель постоянно обновляется на основе новых данных, обеспечивая персонализированный опыт.
Мэдригал подчеркнул, что для критически важных функций, рассчитанных на миллионы пользователей, компания либо разрабатывает решения самостоятельно, либо максимально адаптирует open-source модели. Такой подход не только снижает издержки, но и повышает качество сервиса, что особенно важно для платформы, ориентированной на визуальный поиск и открытия.
Частые вопросы
- Как Pinterest удалось сократить расходы на ИИ на 90%?
- Компания заменила стандартный vision-слой модели Qwen3-VL собственными мультимодальными эмбеддингами, обученными на уникальных данных платформы.
- Какие преимущества дала кастомизация модели Qwen3-VL?
- Снижение затрат на 90%, улучшение качества рекомендаций на 30% и ускорение инференса в 20 раз за счёт использования собственных эмбеддингов.
- Что такое «граф вкусов» в Pinterest?
- Динамическая система, отслеживающая предпочтения пользователей в реальном времени для персонализации рекомендаций и повышения конверсии.
- Почему Pinterest использует open-source модели для критически важных функций?
- Это позволяет максимально адаптировать решения под специфические задачи платформы, снижая издержки и повышая качество сервиса.
Лента для Дзен: /feed/dzen.xml · RSS: /feed.xml