Как я разрабатывал AI-агента новостей с помощью ChatGPT

Идея была простой: «Хочу, чтобы новости сами приходили в нужном формате — чистые, структурированные, готовые к публикации, переписанные под стандарты новостного портала».

Плюс возможность работать с англоязычными источниками и делать новости на русском.

Руками так делать каждый день стало очень скучно — захотелось сделать ИИ-агента.

День 1. Постановка задачи

— Привет, — пишу ChatGPT. — Хочу сделать парсер новостей. Не просто парсер: он должен собирать новости, чистить их, сохранять, а потом переписывать в нужном формате.

ChatGPT: Логично. Давай начнём с технического прототипа: соберём и очистим новости. Потом подключим ИИ для переписывания.

Для теста решили ограничиться тремя последними новостями с каждого сайта — так быстрее отладим логику.

День 2. Первый код и первые ошибки

ChatGPT прислал первый вариант скрипта на Python'е. Запускаю — ошибка.

FileNotFoundError: [WinError 3] Системе не удается найти указанный путь

— Пишет, что файл не найден, — пишу в чат. — Это из-за пробелов в пути, — отвечает ChatGPT. — Возьми путь в кавычки.

Запустил снова — теперь «крякозябры» вместо текста. — Давай сохраним в UTF-8, — предлагает ChatGPT.

Через час скрипт:

  • заходил на сайт,
  • вытаскивал заголовок, дату и текст,
  • сохранял всё в CSV и JSONL.

Оставался «мусор» из обрывков меню и случайных ссылок, но мы добавили фильтрацию, и стало чище.

День 3. HTML-лента

Когда парсер начал выдавать чистые тексты, я предложил: — Давай сделаем HTML-ленту, чтобы смотреть всё в браузере.

Схема была простой: Заголовок → Дата → Текст новости

ChatGPT: Светлая или тёмная тема? Я: Обе!

Так появилась аккуратная страница — почти как на новостном портале.

День 4. Про «интеллект»

— А что насчёт переписывания? — спрашиваю.

ChatGPT: Нужно подключить API генераторов текста — GPT, YandexGPT или аналог. Логика такая:

  1. Парсер собирает новости.
  2. Скрипт отправляет текст в ИИ.
  3. ИИ переписывает по правилам — до 1 500 знаков, стиль новостного портала.
  4. Готовый текст попадает в HTML-ленту.

С английскими материалами — то же самое, только перед переписыванием идёт перевод.

День 5. В облако

На моём компьютере можно тестировать, но для реальной работы надо переносить на виртуальный сервер, чтобы автоматически запускать сбор новостей каждый день и подключаться к CMS портала. А дальше - ручная работа по подчистке того, что написал ИИ, и нажать ОК для публикации.

С ChatGPT обсудили схему: автоматический запуск, ежедневное обновление, контроль и исправления. Параллельно начали прикидывать стоимость разработки и поддержки...

Что есть сейчас:

На данный момент у нас есть прототип, который:

  • собирает новости с заданных сайтов,
  • чистит их,
  • сохраняет в CSV и JSONL,
  • строит HTML-ленту.

Следующий шаг — подключить ИИ для переписывания и перевода. Тогда это полноценный AI-агент.

Промежуточный итог. За несколько часов (хотя я и говорил про дни, но уделял этому по часу-полтора в день) был сделан работающий каркас для интеллектуального новостного агента. Дальше — вопрос доработки и интеграции с CMS.

Процесс продолжается - допиливаем. Будет время - напишу.

Начать дискуссию