Вам когда-нибудь хотелось развидеть увиденное? Риторический вопрос. К сожалению, мы так не умеем (можно разве что сильно удариться головой, но так делать не нужно). А с алгоритмами ИИ такую штуку можно провернуть, это называется «Machine UnLearning» (Machine Learning – это машинное обучение, то есть, процесс, в ходе которого модель выявляет определ…
Сегодня расскажу вам о модели (точнее, семействе моделей) с очаровательным именем. Модель зовут Chinchilla (шиншилла), она создана разработчиками Google и представлена миру в марте 2022 года в статье «Training Compute-Optimal Large Language Models» («Обучение оптимизированных с точки зрения вычислительных затрат больших языковых моделей»).Это модиф…
Периодически в постах про разные модели и подходы к обучению ИИ я пишу про то, что кто-то показал хороший результат в ответах на вопросы или что какие-то модели сравнили, и оказалось, что одна лучше. Сегодня хочу рассказать подробнее про то, как проводятся оценки и как модели сравнивают между собой.Для этого возьмем один конкретный пример – задачу,…
Сегодня пост будет немного более технический, чем обычно, но полезный. Речь пойдет про LangGraph – библиотеку для создания приложений на базе больших языковых моделей. Рассказать о нем решила, потому что он, во-первых, бесплатный, и во-вторых, имеет множество встроенных возможностей для очень гибкой разработки. Им несложно пользоваться. Я сейчас, н…
Я пишу про искусственный интеллект, главным образом в разрезе вариантов его использования (имеющегося и потенциального). Мой тон, как правило, скорее позитивный (и я в самом деле отношусь к развитию этой технологии с большим энтузиазмом). Однако, как и у любой абсолютно технологии, у ИИ есть определенные риски. В разных постах мы их коротко затраги…
Сейчас расскажу вам про одну штуку, которая здорово улучшила качество работы ИИ. Это обучение с подкреплением на основе обратной связи от человека (Reinforcement Learning from Human Feedback). То есть, вы поправляете ИИ, и он запоминает, где и как вы его поправили, чтобы реже делать такие ошибки в будущем. Или вы хвалите ИИ, и он запоминает, что ва…
В продолжение темы об агентах, поговорим сегодня о том, как ИИ можно использовать в науке. В августе этого года вышла статья «The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery» («ИИ-ученый: на пути к полностью автоматизированным и неограниченным научным открытиям»). Авторы выложили свой код в открытый доступ, к нему тоже мож…
Сегодня будет пост на тему, которая уже некоторое время занимает мои мысли. Я исследую ИИ-агентов, экспериментирую с созданием агентных систем и пишу про них у себя в телеграме. Вот подборка постов, которые помогут вам получить больше контекста:
А давайте поговорим о современных рекомендательных алгоритмах. SEO было, разведочный поиск был. Рекомендательные алгоритмы уже сам Бог велел.Важное замечание: у компаний, которые зарабатывают на рекомендательных алгоритмах, нет особенно мотивации все о них рассказывать. Кое о чем можно судить по косвенным признакам, кое-что есть в открытых данных,…
У меня в телеграме недавно вышел важный пост про сохранность данных при работе с большими языковыми моделями. Предлагаю заглянуть.А сегодня поговорим об использовании ИИ в оптимизации для поисковых систем (Search engine optimization, SEO). Эта тема может быть полезна маркетологам, SMM-специалистам и вообще всем, кто взаимодействует с соцсетями, пои…
Модели пост.Сегодня хочу рассказать про первую языковую модель, с которой мне довелось познакомиться – BERT. Семья у этой модели большая, и используют ее много где, хотя по ряду параметров она уступает современным лидерам (GPT, Llama, Claude, PaLM и другим).Некоторые специалисты даже не относят BERT к большим языковым моделям. Во-первых, она значит…
Некоторое время назад был у меня пост про обработку изображений сверточными нейронными сетями. Там я писала, что сверточные нейросети постепенно вытесняются трансформерами (но пока не сдаются).Сегодня поговорим о том, как именно устроены трансформеры для работы с изображениями.