Fred Kurdov

+253

с 2017

3 подписчика

29 подписок

Fred Kurdovв посте

Сравниваем ChatGPT, YangexGPT и Gigachat на цифрах. Кто же лучше знает русский язык?19.02.2024

Качество от токенизации по буквам страдает, в GPT2 публикации вроде еще описывали про трейдоф между vocab size и context length ( намного эффективнее скейлится первое чем второе).

Ответить

Fred Kurdovв посте

Сравниваем ChatGPT, YangexGPT и Gigachat на цифрах. Кто же лучше знает русский язык?18.02.2024

Разница в токенизации, в GPT4 используется BPE tokenizer, обученный на данных в основном на Английском языке. Как результат, один токен на Английском это целое слово или значимый кусок слова а на русском языке это всегда 1 буква. Получается 1000 слов на Английском для модели это ~1300 токенов, а на русском ~6000 токенов.

https://platform.openai.com/tokenizer вот тут можно поиграться и посмотреть как gpt видит текст.

Ответить

Fred Kurdovв посте

Нидерланды: как искать работу айтишнику, где жить и зачем вообще туда 20.11.2023

Ну в Германии гос мед страховка обязательная, где то 600 евро в месяц и все калькуляторы ее уже учитывают, когда считаешь net. Включает в себя все острые медицинские необходимости, походу ко врачу и операции и тд, но не стоматологию и косметологию. Думаю в Нидерландах также или лучше)

Ответить

Fred Kurdovв посте

Euroclear впервые пересмотрел отказ в разблокировке активов российского инвестора 03.08.2023

А можешь пожалуйста написать как ты оформлял претензию евроклиру и что конкретно перекладывал, какие документы?

Ответить

Fred Kurdovв посте

Контракт Spotify с комиком и автором подкастов Джо Роганом обошёлся сервису в $200 млн — NYT 18.02.2022

Потому что он зовет крутых гостей.

Ответить

Fred Kurdovв посте

Купил NFT и теперь не могу ее продать. Реальный кейс провальной сделки 07.02.2022

Хеш на централизованную api ссылку картинки сахарной ваты