Александр Поляков

+89
с 2016

Занимаюсь рекламой и аналитикой данных. Использую в работе машинное обучение. Интересуюсь нейробиологией.

16 подписчиков
29 подписок

Понял, спасибо. Ну под гибрид по сути надо деражть сразу вектор стор и постгрес, причем насколько я знаю бм25 довольно сильно нагружает постгрес и возможно лучше посмотреть в сторону эластика или мантикоры — их легко маштабировать в случае перегруза.

Хочу признаться, что ваши вопросы оказались интереснее всей статьи.

А можете пояснить суть реранкинга и рефрейза? Что это и зачем нужно

Позвонил в МТС, спросил, как отказаться от передачи данных о звонках третьим лицам. Мне сказали, что МТС никому ничего никогда не передает.

Написал в чат МТС, сказали что могут подключить услугу отказа от передачи данных. Вот и верь теперь службе поддержки

14

Более того, всякие эти вонт резалты ставят на сайты скрипт, который не обфусцирован и явно скрывает под собой кейлоггер даже без исключения приватных полей — то есть пароли тоже сливаются

3

Да, настроили. Но если быть корректным, то связь есть с переходом на сайт, а не с кликом по рекламе. В большинстве случаев это тождественные понятия.

Дело в том, что мы не можем знать ничего о том как происходил клик по рекламе, сколько раз пользователь увидел нашу рекламу до клика и т д.

А вот о переходе на сайт нам достаётся уже огромное количество информации: если переход из органической выдачи, мы можем получить реферер из сессии пользователя, если переход происходил по рекламе: то в дополнение к рефереру все ссылки содержат разметку utm_source, utm_medium, utm_campaiign и т д. В utm_content мы передаём широкий спектр параметров включая позицию показа (над или под поисковой выдачей и место на котором мы находились 1,2.... в момент клика), регион местонахождения и т д

То есть набор атрибутов для сессии, которая началась с перехода по рекламе для нас достаточно широкий и позволяет создавать различные фильтры/группировки.

Добавлю, еще. При формировании сделок в CRM через формы на сайте или системой телефонии мы настраиваем передачу в поля сделки неизменяемого поля ClientID — это служебный идентификатор Яндекс.Метрики, который при необходимости можно использовать для более сложной аналитики.

PS: кроме переходов по рекламе у пользователей есть еще один вариант взаимодействия с ней, который будет бедным на атрибуты. Это звонок по телефону, который расположен возле рекламы.
Чаще всего мы знаем только то, что этот звонок был + мы присваимваем разные телефоны разным лендингам и разным рекламным системам, а значит можем знать по рекламе какого из сайтов был звонок и в какой поисковой системе. Это очень "бедные" данные. Гугл выдаёт детальный отчет для таких размещений (ведь у Google Ads работает свой коллтрекинг): можно посмотреть объявление которое видел пользователь, запрос, который он вводил и даже длительность разговора, а вот в Яндексе такие данные получить пока нельзя. Всё что мы можем знать — позвонили через номер телефона в объявлении. Ни текста объявления ни запроса пользователя посмотреть нельзя.

У меня получилось ответить?

Зумкит — серверная штука. Его тоже можно было бы запустить на Амазоне, но не уверен, что экономика сошлась бы. За сервер сейчас я плачу около трёх тысяч в месяц.

1

Вы не можете запросить всех пользователей, которые когда то активировали бота.
Также вы не сможете отправить сообщение тем, кто не активировал бота. 
А ещё не все пользователи телеграм знают свой числовой идентификатор и заставлять клиента добывать его — неудобная затея.

Список пользователей вам надо хранить самостоятельно. Таковы тонкости работы телеграм. 

На самом деле это очень логично, так как помимо идентификаторов у пользователей должны быть какие-то ещё атрибуты, иначе нам уже как бы не нужен бот… если мы всем рассылаем одно и то же сообщение, то мы делаем телеграм-канал.  

А так как есть некая авторизация и разные пользователи должны получать разные сообщения, то нужен бот и мы должны создать и хранить базу данных пользователей. 

У меня в базе такие поля: 

— идентификатор пользователя 
— имя 
— фамилия 
— дата внесения изменений 
— активен бот или нет 
— список отчетов, к которым есть доступ у пользователя. 

Если вы прийдете в бот и активируете его, он запустит функцию записи или обновления ваших данных в базе пользователей.

Про организацию бота. Мне очень нравится API телеграм, оно понятное даже новичкам. Из минусов, вы не сможете получить список всех активировавших бота пользователей. Всё что вы можете, это получить последние обновления в боте через метод getUpdates.

То есть вы должны раз в какой-то период времени опрашивать телеграм на предмет новых пользователей, отправленных боту команд и обрабатывать информацию. Согласитесь — неудобно, а для пользователя будет бросаться в глаза "шов", он написал команду, а бот ему ответил через период обновления, например 20 минут.

Но в телеграме можно сделать так, чтобы бот отправлял все обновления сам на сервер, по HTTP протоколу. Это называется webhook.  Метод документации — /setWebhook

Мы можем настроить HTTP шлюз прямо на Амазоне. То есть Телеграм  будет присылать все обновления прямо в Амазон. Этот запрос будет является тригером для запуска AWS Lambda функции обновления базы данных прользователей. Она берет сообщение, ищет в нём команду и интерпретирует ее. Например если отправить боту /start он включится, а если /stop, перестанет присылать уведомления.
Можно отправить /register и бот будет ждать авторизационного ключа.
Всё поведение бота является реакцией на определенный апдейт, который присылает сам Телеграм.

>8 пункту: используется по сути пароль без логина? решение показалось изящным, одна строка, а не две или три. Плюс в принципе все пользователи являются деанонимизированными — то есть в случае необходимости отключить пользователя можно можно прямо в DynamoDB, ключ авторизации поменять тоже можно там же.

Получилось ответить?

3