Мои 9 прогнозов развития генеративного ИИ на 2024 год

От медицинского ИИ до компьютеров, читающих мысли - 2024 год станет удивительным годом.

Спустя десятилетие мы будем вспоминать 2023 год как год, когда генеративный ИИ начал свое неумолимое шествие к изменению всего того, как мы работаем, ищем и создаем.

От безумного роста ChatGPT, запуска Google Bard, внедрения Midjourney и DALL-E до ускорения регулирования ИИ - 2023 год стал выдающимся годом для генеративного ИИ.

2024 год обещает быть не менее значимым - возможно, даже более. Если 2023 год стал годом открытия человечеством генеративного ИИ, то 2024-й станет первым годом, когда мы начнем по-настоящему ощущать его влияние.

Я работаю в области ИИ уже более десяти лет. Вот мои прогнозы относительно генеративного ИИ на ближайший год.

Если вам интересна тема нейросетей, подпишитесь пожалуйста на мой канал про нейросети, а если вы хотите больше узнать про генерацию изображений, добро пожаловать в этот канал!

2023 год стал годом ChatGPT. Сверхпопулярный чатбот захватил мир, удивив своей популярностью даже своих разработчиков. Такие крупные конкуренты, как Google, почти весь год играли в догонялки.

Bard начинал 2023 год как аутсайдер, который едва мог конкурировать с ChatGPT. В настоящее время он находится практически на том же месте.

В 2024 году все изменится.

Google представила Gemini Ultra - самую мощную базовую модель компании.

Я скептически отношусь к тому, что она будет мощнее ChatGPT и лежащей в ее основе системы GPT-4. Но она, несомненно, будет соответствовать функциям ChatGPT и превзойдет GPT-4 в некоторых областях - в частности, в поиске актуальной информации и точном цитировании источников.

Конечно, OpenAI не собирается отставать. Я прогнозирую, что в начале 2024 года они выпустят GPT-4.5, более мощную и быструю версию GPT-4.

В конце года мы можем ожидать появления GPT-5, в которую, скорее всего, будет интегрирована поддержка видео и другого мультимедийного контента.

Как показало громкое крушение биржи FTX, правительства обожглись из-за своей слабой позиции в отношении регулирования криптовалют. Заслуженно это или нет, но теперь они смотрят на генеративный ИИ с гораздо большей осторожностью.

Если говорить прямо, я считаю, что генеративный ИИ - это гораздо более важная и ценная технология, чем криптовалюта. Но регуляторы вряд ли увидят это в таком свете и уже пытаются сдержать распространение генеративного ИИ.

Учитывая, что 2024 год - это год выборов в Соединенных Штатах, мы увидим много заявлений о генеративном ИИ, но мало действий. В отличие от них, Европейский союз, скорее всего, попытается продвинуться вперед с помощью собственных правил, как это было в случае с конфиденциальностью и GDPR.

Однако регуляторы просто не в состоянии двигаться со скоростью современного генеративного ИИ. Вероятно, в 2024 году мы увидим значимое регулирование, но вряд ли оно будет полностью проработано или введено в действие гораздо позже.

В Соединенных Штатах вместо официального регулирования будет действовать частное гражданское судопроизводство. Мы увидим больше ясности от Бюро по авторским правам в отношении того, какие результаты генеративного ИИ могут, а какие нет, получать защиту авторских прав, и мы должны получить некоторую ясность, возможно, даже от Верховного суда, в отношении правил обучения.

Политика самих компаний также будет определять направление развития. Например, я ожидаю, что в 2024 году Google и другие крупные платформы потребуют обнародовать информацию об использовании ИИ в видеороликах на YouTube.

Еще на заре своего развития я видел потенциал генеративных систем ИИ для чтения мыслей.

Это очень интересно, поскольку у меня фотографическая память, и я бы с удовольствием мог загружать изображения из своего мозга.

В 2021 году ученые продемонстрировали, что чтение изображений из мозга возможно даже с помощью рудиментарных инструментов. В то время я предсказывал, что полномасштабное считывание изображений с мозга с помощью ИИ произойдет в течение 10 лет.

Теперь я думаю, что сроки будут сокращены. Инструменты генеративного ИИ, особенно инструменты для создания изображений, продвигаются вперед гораздо быстрее, чем кто-либо ожидал.

Я ожидаю, что в этом году появятся более масштабные исследования, демонстрирующие доказательство концепции ИИ, который может использовать ЭЭГ или фМРТ для чтения мозга человека и создания реалистичных изображений на основе его мыслей.

Современные видеоролики, созданные ИИ, короткие, зернистые и зачастую странные. Именно так выглядели самые первые фотографии, сгенерированные ИИ, всего несколько лет назад.

Подобно тому, как в 2023 году такие системы, как DALL-E и Midjourney, вырвались вперед, в 2024 году ИИ-видео будет сильно развиваться.

Мы увидим инструменты для создания видео от крупнейших компаний, работающих с ИИ. Видео также станет более реалистичным и гораздо более длинным, чем короткие ролики, создаваемые такими компаниями, как Runway.

Скорее всего, компании будут избегать создания реалистичных видеоаватаров. Вместо этого мы увидим сгенерированные видео на такие темы, как еда, ролики о природе и многое другое. Милые кошачьи видео тоже будут в тренде!

Когда почти десять лет назад компания Google представила свою систему Google Glass, над ней смеялись. Кто захочет носить дурацкие очки с маленьким экраном и камерой на нем?

Сегодня умные очки, как Ray-Bans от Meta (деятельность компании Meta на территории РФ запрещена), выглядят очень круто.

Они также являются идеальным интерфейсом для взаимодействия с генеративным ИИ. Их встроенные камеры позволяют ИИ видеть мир вокруг пользователя, а встроенные динамики позволяют ИИ разговаривать с пользователем.

Сейчас "умные" очки - это крошечный сегмент рынка. Но по мере расширения возможностей искусственного интеллекта я ожидаю, что они будут набирать обороты, как десять лет назад набирали обороты смарт-часы и другие устройства.

Это начнется с того, что такие компании, как Facebook, интегрируют генеративный ИИ непосредственно в очки. Представьте себе очки, которые могут переводить текст на глазах у пользователя, подсказывать ему дорогу во время прогулки по городу и многое другое.

Очки с поддержкой ИИ не станут повсеместными в 2024 году, но они будут восприниматься гораздо серьезнее и выйдут за рамки небольшого сообщества первых последователей. Это произойдет благодаря самым молодым пользователям, которые уже приняли более простые умные очки от таких компаний, как Snapchat.

2023 год стал годом генеративной модели ИИ. Такие LLM, как GPT-4 и Gemini, способны выполнять широкий спектр функций, от написания кода до создания Javascript.

Однако 2024 год станет годом, когда генеративный ИИ станет специализированным. Все больше компаний будут создавать свои собственные модели ИИ, ориентированные на конкретную область, или дорабатывать существующие модели для своих конкретных случаев использования.

Недавно я помог одному из клиентов создать именно такую модель. Она предназначена для создания карт HDRi с помощью ИИ. Если вы похожи на большинство людей, вы, вероятно, думаете: "Что такое карта HDRI?".

Но если вы 3D-дизайнер, который занимается рендерингом автомобилей, то ваша реакция скорее всего будет такой: "Вау, невероятно!".

Раньше стоимость подготовки модели была настолько высока, что только крупные компании или модные стартапы могли собрать капитал, необходимый для ее создания. Теперь же появилось гораздо больше инструментов и ресурсов для тонкой настройки моделей, а также для создания индивидуальных моделей относительно недорого.

Это означает, что все больше компаний будут создавать собственные модели, учитывающие специфику их отрасли. Успех в мире создания моделей будет в меньшей степени зависеть от вычислительной мощности и таланта ИИ, а в большей - от компаний, обладающих лучшими обучающими данными для своей отрасли или сферы деятельности.

Аналогичным образом мы увидим большой шаг в сторону внедрения ИИ в медицине.

До сих пор врачи и другие медицинские работники относились к ИИ со здоровой долей скептицизма. Во многом потому, что взаимодействие с современными системами ИИ требует раскрытия личной идентификационной информации, что зачастую неэтично или незаконно.

Однако по мере того, как LLM будут становиться все меньше и смогут работать на локальных компьютерах или даже мобильных телефонах, мы увидим, что медицинские работники будут все чаще использовать их.

Локальные версии Gemini Nano от Google и аналогичных моделей помогут врачам ставить более точные диагнозы. Также мы увидим, как эта технология будет использоваться в чат-ботах, отвечающих на простые медицинские запросы при неопасных для жизни состояниях, что избавит нас от необходимости посещать врача по незначительным вопросам.

Возможно, ИИ начнут использовать и для некоторых видов терапии. Люди уже используют ChatGPT для этих целей "не по назначению", и стартапы примут это к сведению. Ожидается, что в 2024 году появится больше медицинских и психологических инструментов ИИ.

С распространением контента, генерируемого искусственным интеллектом, компании начнут выделять себя не за счет использования ИИ, а за счет того, что их контент создан человеком.

Особенно в новостях и других редакционных материалах мы можем ожидать, что все больше платформ введут значок или идентификатор "написано людьми" в верхней части своих материалов.

Такие платформы, как Medium и Getty Images, которые сделали ставку на контент, созданный людьми, будут и дальше процветать. Платформы, ориентированные на мейкеров, такие как Etsy, будут вынуждены четко разграничивать материалы, созданные ИИ, и материалы, созданные художниками.

По сути, "созданное человеком" станет новым знаком качества для мастеров, подобно тому, как на продукты питания наклеивают этикетку "Organic". Люди будут искать и готовы платить больше за контент, созданный человеком.

Это будет хорошо и для авторов, и для платформ.

После громкого увольнения Сэма Альтмана в конце прошлого года вопросы безопасности ИИ и экзистенциальных угроз оказались в центре внимания.

Я верю, что ИИ создаст долгосрочные и мощные изменения в нашем обществе и экономике. Но думать, что эти системы способны разрушить мир или стать злоумышленниками, наивно.

Да, он может сделать за вас канцелярскую работу, написать пост в блоге или даже сгенерировать убедительный дипфейк. Но между такой деятельностью и действиями, которые могут представлять угрозу для человечества, лежит большая дистанция.

ИИ умеет писать код, но он и близко не способен взломать атомные электростанции и начать апокалипсис. Он может создать изображение Папы Римского в куртке от Balenciaga, но он не будет обманывать людей фальшивыми предвыборными объявлениями или гнусными сообщениями - по крайней мере, не в мировом масштабе.

У большинства людей, выступающих за агрессивную программу обеспечения ИИ-безопасности, есть и другие причины для этого. Крупные компании хотят, чтобы законодатели поверили в то, что ИИ представляет собой экзистенциальную угрозу, чтобы они принимали больше нормативных актов.

Эти нормы в конечном итоге выгодны крупным компаниям, у которых есть ресурсы для их соблюдения. Это способ создать некий заслон, который вытеснит с рынка более мелких конкурентов, и все это во имя безопасности.

Иронично, что те же люди, которые преуменьшают возможности таких систем, как ChatGPT, говоря, что они могут легко распознать написанные ИИ истории или сгенерированные изображения, беспокоятся о том, что ИИ разрушит мир.

Обреченность ИИ - это всего лишь замаскированная шумиха вокруг ИИ. Если вы считаете, что ИИ способен вызвать такие разрушения, вы негласно утверждаете, что это невероятно революционная и потрясающая мир технология.

Непоследовательно говорить, что результаты LLM - отстой, и одновременно утверждать, что они представляют угрозу для человеческого существования. Во многих отношениях - в частности, в экономическом и социальном - генеративный ИИ изменит мир.

Но так же, как ChatGPT борется с исследованиями, а Бард не может рассказать анекдот, эти системы и близко не стоят с началом апокалипсиса.

Прошедший год стал знаковым для генеративного ИИ. 2024 год будет еще более захватывающим!

#chatgpt #ai #ии #gpt

Источник статьи.

36 комментариев

Igor Zhukov

9 февр

Так уже с помощью чипа в который встроен ИИ с легкостью читают мысли и даже, что самое интересное, парализованные люди могут силой мысли двигать курсор на компьютере, это ли не будущее..