Twitter начала работать над увеличением лимита символов на твит с 280 до 4000 Статьи редакции
Подтвердил Илон Маск.
- На вопрос подписчика «Правда ли, что Twitter собирается увеличить количество разрешенных символов в твитах с 280 до 4000?» Илон Маск ответил «Да».
- Twitter увеличила лимит со 140 до 280 символов на твит в 2017 году. У соцсети есть способы создавать длинные тексты — например, с февраля 2021 года пользователи могут запускать собственные новостные рассылки. Но обычно пользователи создают треды — серию твитов по одной теме. В ноябре 2021 года соцсеть купила сервис Threader, который превращает треды в единый текст. Такая функция будет доступна с Twitter Blue, обновлённую подписку запланировали запустить 12 декабря 2022 года.
- В июне 2022 года Twitter начала тестировать функцию «Записки», через неё можно создавать статьи с заголовком не больше 100 символов и текстом до 2500 слов.
2
показа
12K
открытий
Комментарий недоступен
Комментарий недоступен
Values in VARCHAR columns are variable-length strings. The length can be specified as a value from 0 to 65,535.
https://dev.mysql.com/doc/refman/8.0/en/char.html#:~:text=Values%20in%20VARCHAR%20columns%20are,value%20from%200%20to%2065%2C535.
Комментарий недоступен
А вот тут пишут о MySQL 5.6
https://oshyshkov.com/2019/01/05/what-do-big-websites-like-facebook-google-twitter-and-linkedin-use-for-their-database/
Комментарий недоступен
Все в порядке. Я думал, что Manhattan - это уровень над их форком MySQL. Типа СУБД над СУБД MySQL и других баз. Если не так, то поправьте, я только буду рад, если разжуете.
Комментарий недоступен
Спасибо. В принципе я это и имел в виду. Только описал очень грубо. То есть это по факту надстройка над несколькими СУБД и системами кеширования.
Что у них там сейчас происходит: гуляет фотография с их доски, там вроде бы все расписано. Честно говоря, лень пересматривать.
Комментарий недоступен
Отлично. Было крайне интересно. Без сарказма.
Комментарий недоступен
Комментарий недоступен
Специально глянул лимиты
SQL Server - 8000 байт.
Oracle - 4000 байт (не символов).
С юникодом будет существенно меньше символов.
Ровно в два раза меньше на юникод: varchar - 8k, nvarchar - 4k
Не факт. Может быть UTF-16
Character data types that are either fixed-size, nchar, or variable-size, nvarchar. Starting with SQL Server 2012 (11.x), when a Supplementary Character (SC) enabled collation is used, these data types store the full range of Unicode character data and use the UTF-16 character encoding.
А, точно. Спасибо за уточнение.
Эмодзи? До 6 байт на символ.
All Emojis are treated as Unicode characters, reducing message segments to 70 characters. Older 16-bit Emojis count as a single character count and newer 32-bit emojis count as two characters in a message.
Вы правы, действительно там колдунство. Well, and if you instead consider the Emoji sequence (which is a unit of being rendered as a single Emoji) the longest sequence is 7 characters long, or 28 bytes long in any UTF encodings, thanks to flags expanded to cover subdivisions. (https://news.ycombinator.com/item?id=15306020#:~:text=rise%20of%20emoji-,%3E%20Most%20of%20the%20emoji%20are%203%2Dbyte%20Unicode%20characters.,bytes%20in%20any%20UTF%20encodings.)
Только вот эмодзи - это не символ, а пиктограмма. Так что нещитово ))