AI-агенты нуждаются в терминале, а не только в векторных базах данных

Фото: VentureBeat
Традиционные системы поиска для AI-агентов, такие как Retrieval-Augmented Generation (RAG), основаны на предварительной обработке данных: документы разбиваются на фрагменты, преобразуются в векторные представления и индексируются в базах данных. Однако этот подход имеет существенные ограничения. При обработке запроса система возвращает лишь ограниченный набор релевантных фрагментов, отфильтрованных по семантической близости. Это создает «бутылочное горлышко», так как агент не может получить доступ к данным, не прошедшим через механизм ранжирования.
Метод DCI предлагает принципиально иной подход: AI-агенты взаимодействуют с данными напрямую через командную строку, используя инструменты вроде grep, find и sed. Это позволяет искать точные строки, номера версий, коды ошибок или комбинации ключевых слов, которые сложно обнаружить с помощью семантического поиска. Агенты могут динамически корректировать стратегию поиска, проверять гипотезы и извлекать контекст вокруг найденных совпадений, что критически важно для задач вроде отладки кода или анализа логов.
Исследователи разработали две версии системы: DCI-Agent-Lite на базе модели GPT-5.4 nano для недорогих решений и DCI-Agent-CC с использованием Claude Sonnet 4.6 для более сложных задач. В тестах на бенчмарках, таких как BrowseComp-Plus, DCI показал значительное превосходство над традиционными методами. Например, точность решения задач выросла с 69% до 80%, а стоимость обработки снизилась на 30%. Однако у подхода есть и ограничения: он эффективен для глубокого поиска в ограниченных наборах данных, но теряет производительность при работе с большими массивами информации.
Авторы подчеркивают, что DCI не заменяет векторные базы данных, а дополняет их. Гибридный подход, где семантический поиск используется для первичного отбора данных, а DCI — для точной проверки и анализа, может стать оптимальным решением для корпоративных сред. Исходный код DCI доступен под лицензией MIT, что открывает возможности для интеграции в реальные продукты.
Лента для Дзен: /feed/dzen.xml · RSS: /feed.xml