Парсинг - «это не только ценный мех». Это целая вселенная для человека, умеющего мыслить. Я руководил проектом, где приходилось парсить прогнозы финансовых аналитиков США с ежегодной подпиской на сервис = 20 000$, а наши ребята использовали бесплатный Puppeteer https://pptr.dev/, копировали полный цифровой fingerprint, выпускали еженедельно карточку банковскую, регистрировали ее, платили 7$ и парсили неделю триала, и так год подряд. Эти же навыки использовали для самовыкупов на Wildberries. Автоматом регистрация нового юзера, поиск товара, покупка…
Я рукожоп, поэтому парсинг через XPath прям в Google Sheet ImportHTML. Удобно когда нужно спарсить было характеристики из карточек товаров на Wilberries, сразу перевести на английский не покидая гугл таблиц. И скопироват сразу в Request For Quotation Alibaba, чтобы китайские поставщики сразу тебе искали подобный товар по характеристикам.
@Максим Кульгин, есть супер лайфхак от Wildberries: хочешь защититься от парсинга: херачь в продакшен говнокод, постоянно меняй структуру html, переделывай на лету все:) И это доставляет боль парсеру, но правки на 5-10 минут обычно, просто обидно, когда снова какую-то мелочь поменяли и регулярки не срабатывают:)
Евгений, пишите еще! Юридические моменты не так волнуют стартаперов, пока они не столкнутся с неадекватными действиями инвесторов. Если больше людей будет знать как готовить бизнес к продаже, а другие будут лучше знать, как сокращать риски при покупке — то выиграют все.
Алексей, подробно можете рассказать про электронный договор? Есть ли облачные ЭЦП для физлица, чтобы подписать с вашию юрлицом договор доверительного управления? Как для владельца квартиры выглядит полный процесс согласования и подписания договора?
1. Как вы можете повлиять на то, что ящик у пользователя переполнен?
2. Как организован сбор и хранение данных, на которые настроен Power BI?
3. Что вы закладываете в письма, чтобы вычислять свою аналитику? Ссылку на JS, Zero Pixel еще что-то, что отправляет на ваш сервак инфу об открытии письма?
Спасибо за ответ! Удачи и крутого развития.
Google Sheet Query активно использовали при разработке таблицы или все на классических формулах?
Отделяли ли ввод данных между сотрудниками по отдельным таблицам и потом сводили запросами все в один дашборд или просто сотрудники руками одну таблицу пополняют?
Не буду сильно грузить, просто интересно решали ли вопрос с безопасностью, приватностью данных. Делали на бесплатных аккаунтах гуглопочты или купили G Suite подписку.
А сколько продержалась исходная гуглотабличка, в которой вели финучет KPI сотрудников? Она сразу же показала несостоятельность или по достижении NNN миллионов ежемесячного оборота\числа сотрудников?
Если налить воды в эти клёвые советы, то смело можно выступать с бизнес-тренингами:)
Папетир позволяет полностью записать все параметры живого железа с которого происходит первая регистрация. Более 200 параметров: ширина экрана, версия ОС, город, сборка браузера.. я помню, что вручную мы безуспешно подбирали набор параметров, чтобы не спалиться, что это робот. Но когда фронтендер сохранил свой отпечаток и стал его целиком отдавать (куки это мелочь), то их защита это кушала. По карте специально обученные человек в другой стране покупал предоплаченные карты и мы ими платили. Всем бонус, кто прочитает коммент: МТТ оператор, у которого самая большая ёмкость для покупки виртуальных номеров, Qiwi позволяет выпускать 100 виртуальных карт на один телефонный номер