Thinking Machines Lab пытается победить случайность в ответах нейросетей

Стартап Миры Мурати, собравший 2 миллиарда долларов инвестиций и команду из бывших исследователей OpenAI, впервые рассказал, чем он занимается. Thinking Machines Lab хочет сделать так, чтобы ответы больших языковых моделей были стабильными, а не случайными.

Сегодняшние LLM часто дают разные ответы на один и тот же вопрос, и это давно воспринимается как неизбежность. В Thinking Machines считают, что дело в том, как GPU-ядра от Nvidia взаимодействуют друг с другом в процессе инференса (всего, что происходит после нажатия Enter в ChatGPT). Контролируя этот процесс, можно сделать поведение моделей более предсказуемым.

Первый продукт обещают показать в ближайшие месяцы. Мурати намекает, что он будет ориентирован на исследователей и стартапы, которые создают свои модели.

https://thinkingmachines.ai/blog/defeating-nondeterminism-in-llm-inference/

Подписывайтесь на Telegram GPT/ChatGPT/AI Central Александра Горного.