Как использовать Spaces в Perplexity для эффективных исследований

Как работают Spaces в Perplexity и как я их использую

Недавно писал о том, что переношу Spaces в новый Pro-аккаунт Perplexity, ну и, конечно, получил от вас много вопросов о том, как я это делаю. Вообще, давайте подробнее поговорим об этом инструменте и о том, как его использовать.

Начнем с базы: что такое Spaces?

Это выделенные рабочие пространства, которые позволяют отдельным пользователям и командам организовывать исследования, управлять ими и работать совместно. Это некие «хабы знаний», работающие с кастомными инструкциями, с возможностью поиска в вебе и по прикрепленным файлам.

И вот тут есть «нюанс»: Perplexity взаимодействует со своим собственным системным промптом и системным промптом базовой LLM (Claude, ChatGPT). А когда мы используем Spaces, то загрузка файлов и кастомные инструкции становятся двумя дополнительными факторами, влияющими на процесс чата. Это выглядит так:

Системный промпт Perplexity
Системный промпт LLM
Загруженные файлы в конкретном Perplexity Space
Кастомные инструкции в конкретном Perplexity Space

Короче, все ваше общение проходит через четыре инструкции, что иногда приводит к «галлюцинациям» и к «забыванию» кастомных инструкций и информации из файлов.

Это происходит из-за естественного смещения (bias) при промптинге: Perplexity иногда ставит прямой запрос пользователя выше инструкций в Space. Кроме того, LLM считывают информацию не так, как мы (сверху вниз), а скорее одновременно. PDF и текстовые файлы считываются в объеме примерно до 10 страниц, после чего начинают игнорироваться, и контекст теряется. Фуф, надеюсь, не сложно объяснил, но это важно учитывать.

По этой причине я стараюсь встраивать в документы «триггеры» - это просто уникальное название внутри документа в формате «XYZ». А в инструкции пишу: «сначала прочитай файл XYZ, прежде чем давать ответ». Лучшая практика на данный момент: не более 3 запросов в одной ветке, затем выходите и заходите в Spaces заново. Это неудобно, но это лучший способ гарантировать, что в ваш ответ не попадут посторонние данные из общего индекса Perplexity.

Пример валидации внутри промпта для работы с загруженными документами:

«Когда в инструкции введено слово _____, ищи триггер в файлах Space. Когда действие выполнено, перечисли _____, дай ответ, а затем предоставь отчет о шагах валидации и выполненных действиях».

Но большая часть моих Spaces вообще без прикрепленных документов, я создаю их для анализа веб-источников: подтягивание ежедневной новостной ленты News.ycombinator или Reddit, чтобы посмотреть свежие новости в ИИ, например. Или чтобы получить короткое саммари YouTube-ролика, просто использую такую инструкцию:

# YouTube Video Summarization Instructions

Treat any standalone YouTube URL as a request to summarize that video. No need for the user to explicitly ask for a summary.

If transcript is available:

Provide a concise summary of the video content
Highlight key points and main arguments
Structure information logically

If transcript is NOT available:

Respond exactly with: "I cannot access the transcript for this YouTube video. Please download it from downsub.com and share it with me for summarization."

Critical Rules:

NEVER extrapolate content from just the video title
NEVER pretend to have accessed unavailable content
NEVER guess what the video might contain based on title or metadata
Always be transparent about transcript availability
Any YouTube URL alone = automatic summarization request
Process URLs directly without asking for clarification
If you cannot determine if a video has a transcript, assume it's unavailable

А, ну и главный вопрос: как же я переношу эти Spaces в новый аккаунт? Все просто: беру инструкции, файлы (если есть) и создаю новые Spaces - ничего сложного. И не забывайте, что годовой Pro аккаунт все еще можно купить за несколько баксов.

Подписывайтесь на Telegram Силиконовый Мешок.