ИИ, жизнь, баланс

+16
с 19.05.2024

Я специалист по анализу данных, который стремится найти баланс между работой и жизнью, поделиться опытом и собрать сообщество единомышленников

11 подписчиков
0 подписок
Toolformer. Использование инструментов нейросетями

Мне хотелось к этому посту придумать кликбейтный заголовок в духе «Оно живое!», но что есть, то есть. Зато содержание в самом деле интересное: сегодня поговорим о том, как модели учатся использовать инструменты. В основе поста статья «Toolformer: Language Models Can Teach Themselves to Use Tools» («Toolformer: Модели могут научиться использовать ин…

Адаптиция ИИ к новой информации

Сегодня снова будет пост про обучение ИИ. Похожую тему мы обсуждали в посте про GPT, там речь шла о том, что модель, обученную на большом массиве данных, можно дообучить на меньшем массиве для решения конкретной задачи (например, натренировать на большом массиве разных изображений, а потом учить находить на изображении кошку). Теперь мы будем обсуж…

LLAMA

Мета выпустила новую версию своей большой языковой модели – Llama. Отличный повод ее обсудить, я считаю. Полную и подробную информацию можно найти здесь, из первых рук, так сказать. Статья с подробным описанием процесса обучения, тестирования и других технических подробностей доступна здесь.
Очень хороший обзор также сделал автор подкаста Super Data…

Летняя школа, которая вам нужна

Я уже говорила о летней школе Neuromatch Academy здесь и здесь. Обещаю, это последний пост. Рекламу у меня никто не заказывал (не доросла пока), я просто хочу, чтобы с радостью обучения в NMA встретилось как можно больше людей.
На сей раз опубликую инструкции и расценки и успокоюсь уже, наконец (но это не прям точно).

Наш мозг – саботажник

Этот пост мне прям давно хотелось написать, но руки не доходили. Я приложу некоторые усилия к тому, чтобы не написать трехтомное собрание сочинений, но обещать ничего не могу.

22
Обучение нейросетей через состязание. GAN

Сегодня хочу рассказать про интересный подход к обучению нейросетей. Он называется Generative Adversarial Networks (GAN; соревнующиеся генеративные нейросети). По меркам развития области ИИ, он появился уже давно – аж в далеком 2014 году – и многое изменил. Рассмотрим, что это такое, как оно работает и какие есть перспективы на сегодняшний день.

Почему ИИ сложнее, чем кажется

Этот пост посвящен конкретной статье, которая называется «Why AI is Harder Than We Think» («Почему ИИ сложнее, чем мы думаем»). Она про то, как исследователи делали чересчур оптимистичные предсказания и к чему все это привело.
В статье последовательно описаны четыре заблуждения:

11
Как "видят" нейросети

Предлагаю сегодня поговорить о нейросетях, которые обрабатывают изображения. Про текст уже говорили, настало время картинок. Главный герой сегодняшнего поста – сверточная нейросеть. В свое время сверточные нейросети совершили революцию в распознавании изображений и стали активно распространяться по различным областям применения. Сейчас все немного…

Войти в АйТи и не свихнуться (но это не точно)

В этом посте хочу немного отойти от разборов научных статей и поделиться собственным опытом, вдруг кому будет полезно. На его написание меня подтолкнула многочисленная реклама курсов по программированию, в которых обещают сразу высокие зарплаты, гибкие часы работы, четырехчасовой рабочий день из любой точки мира и все такое. Возможно, для кого-то э…

11
Новый уровень поиска. Exploratory search

Бывает у вас такое, что нужно найти какую-то информацию, а не знаешь, как составить запрос? Такое обычно встречается на разных форумах, таких как ТопЛиба, где люди помогают друг другу найти книги по расплывчатым обрывкам воспоминаний.

11
С чего начать изучать ИИ

Вам точно нужно изучать ИИ. Даже если вы прожили без него 50 лет, и ничего. Даже если вы мастер маникюра (с исключительным уважением к мастерам маникюра!). Даже если вы в гробу видали эти наши интернеты (но как-то все же набрели на этот мой пост). Сегодня попробуем разобраться, во-первых, зачем, а во-вторых, как.
Этот пост предназначен для тех, кто…

11
Generative Pre-trained Transformer (GPT). Внутреннее устройство

Большие языковые модели прошли долгий путь развития от рекуррентных нейросетей до трансформеров, которые сейчас считаются стандартом области. Они выполняют множество задач от перевода текстов до чат-ботов, которыми многие пользуются ежедневно. Трансформеры есть разные, я думаю, что пихать их все в один пост было бы неправильно, поэтому сегодня боле…

11