Gemma 2 9B поглотила в себя колоссальный объем информации – около 8 триллионов токенов, включающих в себя тексты с веб-страниц, коды и математические вычисления.
Ее более крупная версия, 27B, прошла обучение на еще большем массиве данных – приблизительно 13 триллионов токенов.