Теперь мой бот Решатель берет интегралы сложных функций и решает диффуры с сеткой OpenAI O1-preview

За ночь я прикрутил ее к своему боту для школьников, и разбирался, на что она способна.

Теперь мой бот Решатель берет интегралы сложных функций и решает диффуры с сеткой OpenAI O1-preview

Чему равен икс в уравнении x^x = 2^2048? А интеграл x в степени x? А сколько зеленоглазых мудрецов сбежали с острова?

На эти вопросы буквально за минуту отвечает O1-preview.

1/4 - Заставь чатгпт рассуждать и почти "мыслить"

В общем, на днях я сделал бота решателя домашних заданий (@super_botan_bot), и долго думал, как все же заставить его решать задачки на университетском уровне.

Хотелось, чтобы он решал задачи с условного 1 курса матана и физики.

После нескольких ночей тестов понял, что очень решают твои последовательности промптов и то, как ты заставляешь сетки думать, создавать цепочки рассуждений, оценивать их и выбирать правильное решение.

Как я понял, вот этот "процесс мышления" который я пытался автоматизировать и есть примерно тот самый Reasoning от новой сети OpenAI. Только у них это сделано профессионалами.

Ну и конечно же, как только она вышла, я прикрутил её к боту.

2/4 - Вообще, существующие нейросетки уже хорошо справляются со школьными задачами

На школьном уровне, особенно до 9 класса хорошо работают почти все флагманские сети gpt4o, gemini pro 1.5 и claude sonnet 3.5.

Хорошая серия нужных промптов решает многие задачи по научным предметам. И рвет гуманитарные предметы.

На lmarena.ai можно посмотреть текущий Эло рейтинг сеток и узнать что круче всего подходит для ваших задач.

Эло-рейтинг сеток в Математике
Эло-рейтинг сеток в Математике

Круто, что среди них есть супер быстрый Grok. Для Grok это серьезнейшее конкурентное преимущество - лидерство в скорости инференса и рассуждений.

3/4 - С какими задачами круто справляется новая сетка O1 Overview

Вычисляет не самые простые производные:

Теперь мой бот Решатель берет интегралы сложных функций и решает диффуры с сеткой OpenAI O1-preview

Пример решения: очень разумные последовательные шаги.

Просто класс. Еще и ответ совпадает с правильным.

Кстати, круто что в боте решения получаются также в красивой Latex разметке в webapp - пришлось постараться, чтобы ничего не съезжало.

Также:

1) O1 берет несложные интегралы

2) Вычисляет пределы, решает диффуры

3) Может ответить на несложные головоломки

4) Думаю еще много чего

4/4 - Пример головоломки с которой O1 Overview не справилась, но сетка попроще легко решила, после одной подсказки

Теперь мой бот Решатель берет интегралы сложных функций и решает диффуры с сеткой OpenAI O1-preview

Ответ от O1 Overview:

Теперь мой бот Решатель берет интегралы сложных функций и решает диффуры с сеткой OpenAI O1-preview

Но простая сетка после 1 подсказки сразу справилась:

Теперь мой бот Решатель берет интегралы сложных функций и решает диффуры с сеткой OpenAI O1-preview

5/4 Заходите на мой канал

t.me/roman_zharenkov - там про ботов

11
Начать дискуссию