Комментарий недоступен — Аккаунт удален на vc.ru

08.07.2023

GPT-4 имеет 1,76 триллиона параметров и использует технологию 30-летней давности

По слухам, GPT-4 базируется на восьми моделях, каждая из которых имеет 220 миллиардов параметров, связанных в архитектуре Mixture of Experts (MoE). Этой идее почти 30 лет, и она уже использовалась для больших языковых моделей, например, в Switch Transformer от Google.

Аккаунт удален

08.07.2023

Комментарий недоступен

Ответить