Виктор Н. (FractalAgents Ai)

+215

с 2016

Делаем Мультиагентный ИИ

21 подписчик

66 подписок

Виктор Н. (FractalAgents Ai)в посте

xAI запустила бета-версию Grok 4.20 — ответ на вопрос ищут четыре ИИ-агента 18 февр

Ну вообще-то не сильно круто, что 4 ищут, ведь важно чтобы искали лучшие LLM каждый в своей теме. А не одна с разным промтом. Такое есть в Fractal Agents Ai

Ответить

Виктор Н. (FractalAgents Ai)в посте

Бывшая глава Yahoo Марисса Майер привлекла $8 млн в свой новый стартап — он займётся разработкой «ИИ-помощников следующего поколения»24.12.2025

Юзайте мультиагентный ии типа Fractal Agents, тогда возиться с промтами не придётся

Ответить

Виктор Н. (FractalAgents Ai)в посте

Почему Мы Не Должны Верить Техно-Миллиардерам - Великий Обман про ИИ 05.11.2025

Посыл статьи верный. Слыхали про МАС - мультиагентный ии? Не то что сейчас на промтах а настоящее, где агенты кооперируются, способны синтезировать новых агентов. Тогда возможна такая штука, наад которой мы работаем, которую предварительно можно назвать thinking-over-agents в Мультиагентной системе - это когда уровень размышления (да, того самого что в токенах сейчас делают LLM) переходит на уровень выше, не токенов, а агентов. Так вот тут уже недалеко до AGI тк агенты это акторы, а токены нет

Ответить

Виктор Н. (FractalAgents Ai)в посте

xAI выпустила модель Grok 4, которая превзошла в независимых тестах o3, Gemini 2.5 Pro и Claude Opus 10.07.2025

Для этого нужна мультиагентная система: которая сама сере агента оператора зайде на сайты, извлечет нужную инфу, систематизирует и оформит, вставит в нужное место в статье.
Вот вам и полезность реального ии МАС

Ответить

Виктор Н. (FractalAgents Ai)в посте

Зашел тут на реддит и наткнулся на пост который прям в точку попадает в сегодняшние разговоры у кулера между разработчиками 26.06.2025

Я думаю комменты там писала какая-то llm с промтом типа "ты разработчик, твоя задача описывать реальные кейсы где ии помогает".
Ну и другая LLM которая с ней спорила.

Ответить

Виктор Н. (FractalAgents Ai)в посте

«Яндекс» запустил «Нейроэксперта» — сервис для работы с документами, презентациями и ссылками 04.04.2025

Большие файлы грузит по 20мб быстро, за 15 сек, ответы точные, понимает таблицы, есть подкрепление ответов в источнике - можно реально быстро проверить не бред ли сетка сгенерила, очень важно для важных тематик или огромных документов которые вычитать по номенклатуре тяжко
https://fractalagents.ai/

fractalagents.ai

FractalAgentsAI

Ответить

Виктор Н. (FractalAgents Ai)в посте

«Яндекс» запустил «Нейроэксперта» — сервис для работы с документами, презентациями и ссылками 04.04.2025

У нас в Fractal TechDocs загружает быстро, отлично работает с технической сложной документацией, бесплатно попробуйте, и не используются никакие зарубежные чужие сервисы типа Чатгпт, то есть данные не утекают
https://fractalagents.ai/

fractalagents.ai

FractalAgentsAI

Ответить

Виктор Н. (FractalAgents Ai)в посте

OpenAI анонсировала следующее семейство «рассуждающих» моделей — o3 21.12.2024

Ну а у нас есть и GPT модель с доступом в интернет (как Perplexity) https://fractalgpt.ru/

fractalgpt.ru

FractalGPT

Ответить

Виктор Н. (FractalAgents Ai)в посте

Остановитесь на секунду! Задумайтесь, сколько времени вы тратите на прокрутку бесконечных чатов в Telegram, пытаясь найти нужную информацию?28.09.2024

Идея хорошая и правильная. Мы разрабатываем мультиагентный ИИ и на самом деле такой сервис нужно делать на агентах, т.к. иначе будет плохая персонализация под интересы юзера. Это означает что трансформер, который вы используете для извлечения ключевых тематик, или тот промт, который вы даете LLM будет слабо давать суммаризацию по теме - то есть выкидывать важную в данной теме информацию.
Для справки так работает Яндекс Пересказ видео в Ютубе - есть тематики где работает хорошо, есть где очень плохо, и заранее предсказать нельзя, пока ты сам лично не проверишь. И это Яндекс с миллиардами денег, а у стартапа денег не может быть столько, значит у вас будет еще похуже на опенсорсной модели.
То есть довольно неплохо будет работать 2 фичи из ваших 4х:
Пересказ сообщений от конкретных людей 📚
Упоминание определенной темы - вы будете получать уведомления, когда она где-то появляется 🔔

Кстати, а какую монетизацию предполагаете?

Ответить

Виктор Н. (FractalAgents Ai)в посте

Обновление #3 в бенче ContextTrap : FractalGPT, T-lite, Gemma2, Mistral-Nemo, Claude Haiku, GLM4, GPT-4o-mini, DeepSeek-Coder-V2, GPT-3.5, Jamba-instruct, Nemotron-4-340b-instruct 22.07.2024

Привет, спасибо за тест, это как глоток свежей воды, на русском очень мало бенчмарков.

Добавлю пару нюансов, который в основном касаются методологии тестирования.

1. В целом верно, что не полностью корректно сравнивать RAG систему и голые модели. Тут может быть два эффекта:

а) результат RAG системы может быть лучше, при более слабой модели потому, что внутри эмбеддер и поиск уменьшают контекст, поэтому модели нужно отвечать уже по тексту, где точно есть ответ и он очень сжатый. Конечно голая модель вынуждена отвечать по всему контексту, от этого результат может быть хуже.
б) вообще потенциал RAG раскрывается на длинных документах, более 4000 токенов, по сути ограничения на длину нет. То есть RAG система и дешевле и качественнее работает с большими документами.
Например, если даже брать модель с огромным контекстом типа 200к(и более) то стоимость одного запроса может быть и $0.5 долл и вырасти до 1 долл, и все равно этого не хватит, тк у бизнеса документы длиной миллиарды токенов, и все равно их надо как-то нарезать. А вот у RAG системы стоимость не зависит от длины базы знаний компании и составляет порядка $0.2-0.3, даже для гигабайтного документа.
И вся соль в алгоритмах RAG - если они плохие, то качество упадет, а если хорошие, типа графового подхода от Microsoft https://github.com/microsoft/graphrag (похож на FractalGPT) то вырастет.
В общем сервисы можно выделить в отдельную категорию, а там и chatpdf, docsbotai, опен-сорс либы.

2. А могли бы вы рассказать, как реализован пункт Ensemble 8 models ?
Думаю многим это интересно, т.к. сейчас же тренд на агентность - и как раз агенты, каждый из которых решает свою задачу могут супер повышать качество всего продукта. Например более сложный вопрос может направляться на бОльшую модель, а простой - на легкую, зачем тратить деньги, если он простой и мы уверены, что получим ответ и на 3b модели.

В будущем бенчмарк круто было бы расширить и на всякие модальности: то что я знаю бизнес прям плачет и просит работу с таблицами и картинками, там много проблем.

github.com

GitHub - microsoft/graphrag: A modular graph-based Retrieval-Augmented Generation (RAG) system

Ответить