Как я разрабатывал AI-агента новостей с помощью ChatGPT
Идея была простой: «Хочу, чтобы новости сами приходили в нужном формате — чистые, структурированные, готовые к публикации, переписанные под стандарты новостного портала».
Плюс возможность работать с англоязычными источниками и делать новости на русском.
Руками так делать каждый день стало очень скучно — захотелось сделать ИИ-агента.
День 1. Постановка задачи
— Привет, — пишу ChatGPT. — Хочу сделать парсер новостей. Не просто парсер: он должен собирать новости, чистить их, сохранять, а потом переписывать в нужном формате.
ChatGPT: Логично. Давай начнём с технического прототипа: соберём и очистим новости. Потом подключим ИИ для переписывания.
Для теста решили ограничиться тремя последними новостями с каждого сайта — так быстрее отладим логику.
День 2. Первый код и первые ошибки
ChatGPT прислал первый вариант скрипта на Python'е. Запускаю — ошибка.
FileNotFoundError: [WinError 3] Системе не удается найти указанный путь
— Пишет, что файл не найден, — пишу в чат. — Это из-за пробелов в пути, — отвечает ChatGPT. — Возьми путь в кавычки.
Запустил снова — теперь «крякозябры» вместо текста. — Давай сохраним в UTF-8, — предлагает ChatGPT.
Через час скрипт:
- заходил на сайт,
- вытаскивал заголовок, дату и текст,
- сохранял всё в CSV и JSONL.
Оставался «мусор» из обрывков меню и случайных ссылок, но мы добавили фильтрацию, и стало чище.
День 3. HTML-лента
Когда парсер начал выдавать чистые тексты, я предложил: — Давай сделаем HTML-ленту, чтобы смотреть всё в браузере.
Схема была простой: Заголовок → Дата → Текст новости
ChatGPT: Светлая или тёмная тема? Я: Обе!
Так появилась аккуратная страница — почти как на новостном портале.
День 4. Про «интеллект»
— А что насчёт переписывания? — спрашиваю.
ChatGPT: Нужно подключить API генераторов текста — GPT, YandexGPT или аналог. Логика такая:
- Парсер собирает новости.
- Скрипт отправляет текст в ИИ.
- ИИ переписывает по правилам — до 1 500 знаков, стиль новостного портала.
- Готовый текст попадает в HTML-ленту.
С английскими материалами — то же самое, только перед переписыванием идёт перевод.
День 5. В облако
На моём компьютере можно тестировать, но для реальной работы надо переносить на виртуальный сервер, чтобы автоматически запускать сбор новостей каждый день и подключаться к CMS портала. А дальше - ручная работа по подчистке того, что написал ИИ, и нажать ОК для публикации.
С ChatGPT обсудили схему: автоматический запуск, ежедневное обновление, контроль и исправления. Параллельно начали прикидывать стоимость разработки и поддержки...
Что есть сейчас:
На данный момент у нас есть прототип, который:
- собирает новости с заданных сайтов,
- чистит их,
- сохраняет в CSV и JSONL,
- строит HTML-ленту.
Следующий шаг — подключить ИИ для переписывания и перевода. Тогда это полноценный AI-агент.
Промежуточный итог. За несколько часов (хотя я и говорил про дни, но уделял этому по часу-полтора в день) был сделан работающий каркас для интеллектуального новостного агента. Дальше — вопрос доработки и интеграции с CMS.
Процесс продолжается - допиливаем. Будет время - напишу.