На что способна новая версия Midjourney v6. Дайджест самых громких и полезных новостей о нейросетях
Более качественная генерация, понимание промптов и даже генерация текста на изображениях. Разработчики Midjourney успели представить новую 6 версию до Нового года, чтобы мы успели сгенерировать самые красивые открытки и фотосессии к празднику.
Всем привет! Меня зовут Марат Шаниязов. Я технологический предприниматель и основатель клуба экспертов по нейросетям «Нейробит». Сегодня поговорим об очках Ray-Ban со встроенной нейросетью, серьезном конкуренте GPT и танцующих роботах от компании «Тесла».
Новая версия Midjourney v6.
Кроме улучшений качества и разрешения изображений по всем фронтам, наконец-то представили рабочую веб-версию нейросети. Сейчас ее вовсю используют те, кто успел нагенерить более 10 тысяч картинок. Для всех пользователей доступ обещают открыть в начале 2024 года.
На сайт собираются добавить опцию «Коллекции» для сортировки нейро - произведений и быстрого экспорта. Также появится возможность взаимодействовать с контентом других пользователей с помощью опции «Explore».
Нейросеть стала более чувствительной к словам в промптах, поэтому изменился алгоритм построения запроса. Используйте разговорный язык и избегайте подсказок вроде «4K», «8K», «HD» и отсылок к стилям «фотореализм», «цифровое искусство» и так далее. Просто опишите то, что хотите увидеть.
Языковая модель лучше, чем GPT-3,5?
Французская компания Mistral AI анонсировала Mixtral for experts. Это уникальная модель, которая работает не как GPT или Llama 2.
Когда вы посылаете ей запрос, она обращается не к огромной базе данных, а к небольшим базам-специалистам. Например, разработчику, креативщику, маркетологу и так далее. Mixtral сама определяет, кто поможет ей решить ваш запрос, и выдает точные и профессиональные ответы. По крайней мере, должна. Пока доступна только запись для раннего доступа.
В ChatGPT появятся актуальные новости.
Компания Axel Springer, владеющая крупными американскими СМИ, собирается сотрудничать с Open AI. Это означает, что ChatGPT будет использовать контент этих медиаресурсов для предоставления информации о событиях.
Gemini Pro доступен бесплатно.
Поиграться с нейронкой можно через Google AI Studio. В комплекте компания выпустила Gemini Pro Vision — глаза для чат-бота.
API модели тоже доступен пока бесплатно в пределах менее 60 запросов в минуту. Окно контекста вмещает 32 000 символов.
Умные очки от Ray-Ban и Meta (запрещен на территории РФ) отвечают на вопросы.
Они работают на базе модели Llama 2 и выводят на стеклах ответы на вопросы по типу: «Что я сейчас вижу?» Плюс очки делают фото и записывают видео. Отличная штука для блогеров.
Прошла всего неделя с прошлого дайджеста, а сколько всего произошло! Нейросети и возможности Искусственного Интеллекта с каждым днем развиваются и поражают. Интересно, что произойдет, когда мы выйдем с зимних каникул? Роботы от Тесла заполонят улицы, выйдет GPT-20 и Midjourney-50?
Всех с наступающим Новым годом! Если вдруг на момент публикации выйдет громкая новость — я опубликую ее в своем канале «Нейробит». Там я каждую неделю провожу онлайн-встречи с подписчиками, где мы обсуждаем все обновления и релизы, а также разбираем, как бы на них заработать. Присоединяйтесь!