Как ChatGPT помог создать бесплатный редактор PDF для удаления фона

Фото: ZDNet
Краткий ответ
Журналист ZDNet столкнулся с задачей удалить жёлтый фон из отсканированных нотных листов, чтобы сэкономить чернила при печати и улучшить распознавание приложением PlayScore 2*. Однако использование Photoshop оказалось слишком трудоёмким, а прямое применение ChatGPT вызывало опасения из-за возможных искажений оригинала. Решение нашлось в написании детерминированного Python-скрипта с помощью нейросети, который точно удалял фон, не затрагивая ноты и текст.
Задача удаления цветного фона из PDF-файлов может показаться тривиальной, но на практике она часто вызывает сложности. В случае с отсканированными нотными листами на жёлтой бумаге стандартные инструменты вроде Photoshop требовали ручной настройки для каждого изображения, что отнимало много времени. Прямое использование ChatGPT для обработки файлов тоже не подходило: нейросеть могла внести нежелательные изменения в содержимое, что критично для музыкальных нот.
Автор решил проблему, попросив ChatGPT сгенерировать Python-скрипт, который работает по чёткому алгоритму. Скрипт анализирует каждый пиксель изображения: если он не чёрный или серый (с учётом лёгких оттенков), то заменяется на белый. Это позволило сохранить качество оригинала и избежать неопределённости, свойственной нейросетям. Инструмент поддерживает многостраничные PDF и работает через командную строку, что упрощает массовую обработку файлов.
Готовый скрипт доступен в репозитории автора на GitHub. Пример работы показан на публичном доменном произведении из архива Нью-Йоркской публичной библиотеки. Подход демонстрирует, как можно использовать AI не напрямую, а для создания детерминированных инструментов, которые решают конкретные задачи без риска искажений. Это особенно актуально для задач, где важна точность, например, при работе с документами или графическими материалами.
Частые вопросы
- Частые вопросы
- Журналист ZDNet столкнулся с задачей удалить жёлтый фон из отсканированных нотных листов, чтобы сэкономить чернила при печати и улучшить распознавание приложением PlayScore 2*. Однако использование Photoshop оказалось слишком трудоёмким, а прямое применение ChatGPT вызывало опасения из-за возможных искажений оригинала. Решение нашлось в написании детерминированного Python-скрипта с помощью нейросети, который точно удалял фон, не затрагивая ноты и текст.
Лента для Дзен: /feed/dzen.xml · RSS: /feed.xml