{"id":5097,"title":"\u041f\u0440\u0438\u0432\u043b\u0435\u043a\u0438\u0442\u0435 \u0432 \u041c\u043e\u0441\u043a\u0432\u0443 \u0442\u0443\u0440\u0438\u0441\u0442\u043e\u0432 \u0438 \u043f\u043e\u043b\u0443\u0447\u0438\u0442\u0435 \u043f\u043e\u0434\u0434\u0435\u0440\u0436\u043a\u0443 \u043e\u0442 \u0430\u043a\u0441\u0435\u043b\u0435\u0440\u0430\u0442\u043e\u0440\u0430","url":"\/redirect?component=advertising&id=5097&url=https:\/\/vc.ru\/promo\/274398&hash=37380e26d7e18a53827df77f3494106574fc9389fcbf0d03cb47fab2464f807b","isPaidAndBannersEnabled":false}

Twitter Илона Маска в Telegram с переводом на русский

Хочу поделиться одной моей поделкой, возможно, кому-то она тоже будет полезна. В этой статье я поделюсь тем, что я сделал, чтобы читать Twitter-аккаунт Маска в удобном мне месте и имея под рукой перевод англоязычных твитов на русский.

Проблема

Последние несколько лет замечаю за собой, что хочу начать регулярно почитывать тот или иной блог, но если он не находится в зоне удобного или привычного доступа (к сожалению весь твиттер для меня таков, ничего не могу с собой поделать, не читатель я твиттера), то я довольно быстро забиваю на это. Еще хуже, если блог на другом языке, тут появляется дополнительная проблема, когда из-за технических терминов или разговорного жаргона сложно понять смысл. Собственно такие "преграды" обычно и приводят к тому, что вроде бы и хочется, но как-то не делается.

Идея

Сейчас я делаю на заказ программных роботов, которые в онлайне обрабатывают новостные потоки в соцсетях, фильтруют, выбирают наиболее интересные и цитируемые, и передают заказчику. Я подумал, почему бы мне не использовать свои навыки и не облегчить себе жизнь в описанной выше проблеме. Для этого нужно только каждые сколько-то минут заходить в твиттер, забирать новые сообщения, прогонять их через переводчик и отправлять в канал в телеграме. Кажется, ничего сложного.

Подводные камни

Первая проблема, с которой я столкнулся, это фрилансеры, у которых я пытался заказать кусок кода, который непосредственно выгружает новые посты из твиттера, все подряд отказывались от выполнения заказа. Прямо брали, а потом у одного компьютер сломался, у другого появились другие дела, третий в последний момент передумал.

Вторая проблема, отказ твиттера в выдаче доступа к API в описанных мной кейсах. То есть остается единственный вариант заниматься веб-скраппингом. Ну что ж.

Третья проблема, оказалось, что требуется довольно много ручной работы, чтобы преобразовать пост из твиттера в формат телеграма, и чтобы он прилично выглядел. В частности, картинки, предпросмотры ссылок, упоминания и тд.

Технологии

Я решил попробовать самостоятельно и начал гуглить что-то вроде "parsing twitter without API". Нашлось достаточно много решений, сразу скажу, что решение twint — библиотека с открытым исходным кодом, которая вполне работоспособна и подошла под мою задачу.

Для того, чтобы перевести текст с английского на русский, я сначала было собирался использовать google translate, но понимал, что в нем ограниченное количество бесплатных переводов, решил что попробую использовать единственную известную мне нейросеть для перевода с английского на русский fairseq от Facebook AI Research. Качество перевода показалось мне вполне приемлемым с точки зрения того, чтобы понять в чем суть твита, хотя оно и не было идеальным.

Все это я обернул в скрипт на языке программирования python и запустил на постоянную работу на своем сервере.

Как пользоваться

Выглядит сейчас это следующим образом. Каждый твит и ретвит на главной странице твиттера Илона Маска пропускается через переводчик, подбираются ссылки и картинки из поста, дальше все это сохраняется в пост в телеграм-канале. Выглядит это так

Как выглядит пост в телеграме

Итого у меня получился телеграм-канал под названием "Твиттер Илона Маска" (подписывайтесь, мне будет приятно, что это нужно кому-то еще 🤗, будет дополнительный стимул поддерживать в будущем), в котором можно

1) читать новые и старые посты Илона Маска

2) видеть перевод текста на русский язык

3) перейти по ссылке на исходный пост в твиттере

И все это без регистрации и смс:)

Если эта статья показалась вам интересной, поставьте, пожалуйста апвоут (так ее увидит больше людей) и подписывайтесь на мой блог в телеграме, там я ежедневно рассказываю о всех своих экспериментах. Если хотите решить похожую проблему для своего бизнеса — пишите в личку.

{ "author_name": "Кирилл Балахонов", "author_type": "self", "tags": [], "comments": 23, "likes": 26, "favorites": 16, "is_advertisement": false, "subsite_label": "social", "id": 258958, "is_wide": true, "is_ugc": true, "date": "Tue, 15 Jun 2021 22:06:02 +0300", "is_special": false }
0
23 комментария
Популярные
По порядку
Написать комментарий...
3

Мне, кстати, читатели твиттера Маска чем-то напоминают читателей пабликов Бизнес в VK.
Не камень в твой огород, если что

Ответить
0

Интересно же, что он там пишет, что потом котировки компаний и криптовалют пробивают уровни)

Ответить
1

Всё гораздо проще : подписываешься в твиттере на Илона Маска, ставишь отметку на получение уведомлений о его твитах. В этом случае тебе будут приходить об этом уведомления как ответы. Включаешь пуш, и эти уведомления будут всплывать на устройстве, даже если ты не запустил само приложение. 

Ответить
6

Да я согласен что можно проще, но не удобнее для меня лично. У меня это как с фейсбуком, я не являюсь постоянным пользователем, поэтому сделать там любое действие это ux-боль=))) то ли дело телега)

Ответить
1

Согласен. ФБ ужасен

Ответить
0

Ну тут складывается впечатление, что разные поколения в разных странах прошли свой путь совместного развития с ui/ux соцсети, в которой проводили много времени. я со школы и в инсте пользовался вк, после него в фб ничего не понятно. у кого-то уверен наоборот

Ответить
1

Думаю тренд на социальные сети спадает

Ответить
2

Не благодарите

Ответить
2

спасибо, а как быть с тем, что твиттер в рф не очень популярен и ходить туда только за Маском не очень нативно получается?)

Ответить
1

Маск везде говорит одно и тоже, что а твиттере, что на Ютуб

Ответить
0

есть такое, только в твиттере он ещё как выложит что-нибудь  эдакое, что фондовый рынок разрывает на части) 

Ответить
1

А как вы фиксируете уже выложенные публикации?

Ответить
1

Я их разово прогнал, а дальше уже скрипт ждет новых. Или вы о чем-то другом?

Ответить
1

Я о том, как скрипт отличает новые твиты от старых :)

Ответить
2

он смотрит на ссылки последних постов в телеге и по id определяет максимальный. из твиттера рассматривает уже только те, у которых id больше максимального:)

Ответить
1

Понял, благодарю =)

Ответить
1

А как скрипт ждёт новых? Скрапит Твиттер каждую минуту/час ?

Ответить
1

Все верно скрапит с интервалом, других способов на данный момент насколько я знаю не существует

Ответить
1

Подписался ))

Ответить
1

А с русского на узбекский так можно? Или совсем плохо переводит?

Ответить
0

С помощью той технологии, которую я использовал не получится, там прям по пальца посчитать можно сколько языков доступны - немецкий, французский и итальянский кажется только

Ответить
Читать все 23 комментария
Как подготовиться к жизни без cookies: рекомендации маркетологам

О технологии Federated Learning of Cohorts (FLoC), которая заменит cookies, Google объявил еще в начале года. Недавно компания анонсировала перенос запуска технологии на 2023 год, и теперь у рынка интернет-маркетинга есть 2 года, чтобы найти альтернативу работе с данными. Как выглядит ситуация сейчас и что делать маркетологам — в обзоре от AiData.

Из-за шума животные уходят из городов и лесов, а у людей он вызывает стресс: как исследователи борются за тишину Статьи редакции

Организация Quiet Parks International открывает «тихие парки» по всему миру, пытается защитить леса от шума, привлечь туристов и инвестиции.

Директор QPI по диким паркам в Азии Лайла Чин-Хуэй Фань Wired
Альфа банк самовольно закрыл зарплатный счет

При трудоустройстве в организацию мне предложили открыл счет для перечисления заработной платы в Альфа Банке. Ну Альфа Банк так Альфа Банк, мне в целом было не принципиально на какой счет приходит зарплата.

Как превратить юристов из бюрократов в опору компании

Бывает, что корпоративные юристы — люди, которые не показываются из кабинета и иногда вставляют палки в колёса другим отделам. Но в «Фоксфорде» они сами ходят к бизнес-заказчикам и предлагают идеи. Юрист онлайн-школы «Фоксфорд» Катя Кулакова рассказывает, как работает юридический отдел, который живёт интересами компании.

Катя Кулакова, юрист онлайн-школы "Фоксфорд"
«Подрядчики запустили рекламу и ‟потеряли” 350 млн рублей»: почему на digital-рынке врут, косячат и крадут

13 историй о том, какие иллюзии есть у заказчика онлайн-рекламы, когда он поручает маркетологам задачи.

Грущу из-за всего, что осознал
Как найти хорошего графического дизайнера?

Давайте разберемся, почему одни агентства просят за свою работу 500 000 рублей, а другие 15 000 рублей.

Duolingo: на чем зарабатывает сервис, весь контент которого доступен бесплатно

Несколько недель назад сервис, помогающий изучать иностранные языки, подал заявку на IPO в США. Давайте посмотрим, почему он так популярен, и на чем они вообще зарабатывают.

Жиросжигание и жирапотери — это разные вещи. Что важнее?

Что ты чувствуешь, сползая с элипса, велосипеда или дорожки, проделав часовую кардио работу в жиросжигающем пульсе 140? Покалывания внизу живота или на боках, как-будто прямо сейчас там плавится жир. Или мокрая майка, которая убедительно пахнет сгоревшими триглицеридами.

Сказ о том, как Авито собакенов обижает и на деньги кидает
С фокусом проблемы, сорян. @alpajessica

Если не интересно читать про мошенников, а хочется поднять себе настроение, то вам в конец статьи - там милейшие фотокарточки чудесных пёселей.

Как малому бизнесу понять свою «зону смерти»

Риск-менеджмент традиционно считается уделом крупных компаний. Кроме них просчитывают риски разве что стартапы, и те по требованию инвесторов. Малый и средний бизнес (МСБ) работает без подобной аналитики — ему не до этого. Предпринимателей можно понять, когда ты поднимаешься с нуля или масштабируешь проект, мысль идет в векторе достижения…

31 июля завершается приём заявок в 1-й этап отбора программы B2C Future Solutions
null