Как использовать Spaces в Perplexity для эффективных исследований

Как работают Spaces в Perplexity и как я их использую

Недавно писал о том, что переношу Spaces в новый Pro-аккаунт Perplexity, ну и, конечно, получил от вас много вопросов о том, как я это делаю. Вообще, давайте подробнее поговорим об этом инструменте и о том, как его использовать.

Начнем с базы: что такое Spaces?

Это выделенные рабочие пространства, которые позволяют отдельным пользователям и командам организовывать исследования, управлять ими и работать совместно. Это некие «хабы знаний», работающие с кастомными инструкциями, с возможностью поиска в вебе и по прикрепленным файлам.

И вот тут есть «нюанс»: Perplexity взаимодействует со своим собственным системным промптом и системным промптом базовой LLM (Claude, ChatGPT). А когда мы используем Spaces, то загрузка файлов и кастомные инструкции становятся двумя дополнительными факторами, влияющими на процесс чата. Это выглядит так:

  • Системный промпт Perplexity
  • Системный промпт LLM
  • Загруженные файлы в конкретном Perplexity Space
  • Кастомные инструкции в конкретном Perplexity Space

Короче, все ваше общение проходит через четыре инструкции, что иногда приводит к «галлюцинациям» и к «забыванию» кастомных инструкций и информации из файлов.

Это происходит из-за естественного смещения (bias) при промптинге: Perplexity иногда ставит прямой запрос пользователя выше инструкций в Space. Кроме того, LLM считывают информацию не так, как мы (сверху вниз), а скорее одновременно. PDF и текстовые файлы считываются в объеме примерно до 10 страниц, после чего начинают игнорироваться, и контекст теряется. Фуф, надеюсь, не сложно объяснил, но это важно учитывать.

По этой причине я стараюсь встраивать в документы «триггеры» - это просто уникальное название внутри документа в формате «XYZ». А в инструкции пишу: «сначала прочитай файл XYZ, прежде чем давать ответ». Лучшая практика на данный момент: не более 3 запросов в одной ветке, затем выходите и заходите в Spaces заново. Это неудобно, но это лучший способ гарантировать, что в ваш ответ не попадут посторонние данные из общего индекса Perplexity.

Пример валидации внутри промпта для работы с загруженными документами:

«Когда в инструкции введено слово _____, ищи триггер в файлах Space. Когда действие выполнено, перечисли _____, дай ответ, а затем предоставь отчет о шагах валидации и выполненных действиях».

Но большая часть моих Spaces вообще без прикрепленных документов, я создаю их для анализа веб-источников: подтягивание ежедневной новостной ленты News.ycombinator или Reddit, чтобы посмотреть свежие новости в ИИ, например. Или чтобы получить короткое саммари YouTube-ролика, просто использую такую инструкцию:

# YouTube Video Summarization Instructions

Treat any standalone YouTube URL as a request to summarize that video. No need for the user to explicitly ask for a summary.

If transcript is available:

  • Provide a concise summary of the video content
  • Highlight key points and main arguments
  • Structure information logically

If transcript is NOT available:

  • Respond exactly with: "I cannot access the transcript for this YouTube video. Please download it from downsub.com and share it with me for summarization."

Critical Rules:

  • NEVER extrapolate content from just the video title
  • NEVER pretend to have accessed unavailable content
  • NEVER guess what the video might contain based on title or metadata
  • Always be transparent about transcript availability
  • Any YouTube URL alone = automatic summarization request
  • Process URLs directly without asking for clarification
  • If you cannot determine if a video has a transcript, assume it's unavailable

А, ну и главный вопрос: как же я переношу эти Spaces в новый аккаунт? Все просто: беру инструкции, файлы (если есть) и создаю новые Spaces - ничего сложного. И не забывайте, что годовой Pro аккаунт все еще можно купить за несколько баксов.

Подписывайтесь на Telegram Силиконовый Мешок.

Начать дискуссию