Thinking Machines Lab пытается победить случайность в ответах нейросетей
Стартап Миры Мурати, собравший 2 миллиарда долларов инвестиций и команду из бывших исследователей OpenAI, впервые рассказал, чем он занимается. Thinking Machines Lab хочет сделать так, чтобы ответы больших языковых моделей были стабильными, а не случайными.
Сегодняшние LLM часто дают разные ответы на один и тот же вопрос, и это давно воспринимается как неизбежность. В Thinking Machines считают, что дело в том, как GPU-ядра от Nvidia взаимодействуют друг с другом в процессе инференса (всего, что происходит после нажатия Enter в ChatGPT). Контролируя этот процесс, можно сделать поведение моделей более предсказуемым.
Первый продукт обещают показать в ближайшие месяцы. Мурати намекает, что он будет ориентирован на исследователей и стартапы, которые создают свои модели.
Подписывайтесь на Telegram GPT/ChatGPT/AI Central Александра Горного.