Ваше рабочее место под угрозой, теперь точно — новости AI в дайджесте #6

Хайп вокруг автобота Маска, Ray-Ban всегда в моде, Apple наконец-то вошел в гонку и на десерт: 2 крутые AI-фичи. Подробности в дайджесте (с видео).

Ваше рабочее место под угрозой, теперь точно — новости AI в дайджесте #6

Хеллоу, vc.ru! С вами команда корпоративного мессенджера Compass.

Подготовили для вас шестой выпуск еженедельного дайджеста с новостями в мире AI.

Optimus Gen-2

Tesla представила второе поколение своего гуманоидного робота Optimus. Робот пока ничем серьезным не занят — танцует, гуляет и двигает коробки. Но это не весь его потенциал.

На видео Optimus Gen-2 демонстрирует движения более приближенные к человеческим, чем его предыдущая версия. Он похудел на 10 кг и ходит на 30% быстрее — шансов на то, что он вас догонит и не упадет стало больше.

Главное отличие от других гуманоидных роботов — новые руки с тактильными датчиками на кончиках пальцев. Благодаря им робот может брать и аккуратно переносить хрупкие вещи, например, яйцо. Теперь понятно почему цены на них так взлетели — тысячи яиц ушли на отладку бота.

Фанаты «Detroit: Become Human» знают, к чему все идет: через 5-7 лет Optimus возьмет на себя домашнюю рутину, подаст Петровичу ключ на 12 и вполне себе вольется в социум. Не удивляйтесь, если этот Tesla-boy займет ваше рабочее место через 10 лет, а потом внезапно начнет искать Иерихон.

Optimus Gen-2 показывает значительный прогресс в области роботостроения. Отечественные специалисты стараются не отставать. Например, инженеры НИИ механики МГУ активно дорабатывают своего шагающего четырехногого робота и совсем скоро дадут жару Boston Dynamics. Осталось дождаться, когда роботы в РФ будут также круто танцевать, как Optimus.

Ray-Ban с AI на борту

Meta* представила обновление для своих умных очков Ray-Ban Meta collection. Теперь в очки интегрирован мультимодальный искусственный интеллект, который может распознавать объекты вокруг и реагировать на голосовые команды.

* Компания Meta признана экстремистской организацией на территории Российской Федерации

Ваше рабочее место под угрозой, теперь точно — новости AI в дайджесте #6

Благодаря камерам и микрофонам очки теперь могут идентифицировать предметы, описывать то, на что смотрит пользователь, предлагать подписи к фотографиям. Например, можно попросить очки подобрать пару брюк к рубашке или перевести текст с иностранного языка.

Также есть интеграция с поисковиком Bing — можно задавать вопросы об актуальных новостях, погоде, ресторанах поблизости. Всё это делается голосовыми командами через виртуального помощника Meta AI.

В очках 32 ГБ памяти, сверхширокоугольная камера 12 МП и подключение к телефону через приложение Meta View. Стоимость — 300$. Время автономной работы — до 6 часов.

Но во всем есть своя цена. Корпорации будут получать инфу для таргета не только от вашего iPhone, а «товарищ майор» посмотрит на мир вашими глазами.

Apple AI Framework

Apple выпустила MLX — фреймворк для машинного обучения и библиотеку моделей MLX Data. Это инструменты для разработки AI-приложений на базе чипов Apple.

Ваше рабочее место под угрозой, теперь точно — новости AI в дайджесте #6

MLX — это программное обеспечение для обучения языковых и генеративных AI-моделей, таких, как Llama и Stable Diffusion. Оно работает исключительно на чипах Apple Silicon.

MLX Data — это готовые наборы данных для обучения, которые также оптимизированы для чипов Apple. Можно все скачать на github.

С помощью этих инструментов можно создавать приложения с AI на борту для экосистемы Apple. Возможно даже получится создать эмулятор x86 на ARM архитектуре и погонять в Cyberpunk 2077 на Mac без лагов и вылетов.

Это важный шаг Apple в сфере AI. Компания долго не проявляла активности в этой области, а теперь нас ждет бум AI-приложений в App Store. В долгосрочной перспективе может появлиться «сильный» ассистент, интегрированный в устройства Apple. Прости, Siri.

Llamafile. AI на флешке

Компания Mozilla представила новый open-source проект под названием Llamafile.

Ваше рабочее место под угрозой, теперь точно — новости AI в дайджесте #6

Llamafile преобразует базы данных нейросетей, таких, как Mistral-7B-Instruct или WizardCoder-Python-13B, в исполняемый файл. Теперь «голую» AI можно запустить в пару кликов на популярных операционных системах, например, macOS, Windows, Linux, без необходимости установки дополнительного ПО.

Проект создан на основе двух популярных open source решений:

  • llama.cpp — framework для создания чат-ботов на основе нейросетевых моделей.
  • Cosmopolitan Libc — библиотека для кроссплатформенной разработки на Си.

Благодаря объединению этих проектов удалось создать универсальный формат исполняемых файлов, который поддерживает как CPU, так и GPU-вычисления и может запускаться на широком спектре устройств.

По заявлению Mozilla, Llamafile должен существенно упростить распространение нейросетевых чат-ботов среди обычных пользователей. Например, чат-бот можно загрузить на флешку и использовать на разных ПК, вся информация будет храниться только на флешке. Llamafile распространяется под лицензией Apache 2.0, что делает его полностью открытым для модификаций и улучшений со стороны сообщества.

tldraw. Превращаем наброски в HTML-код или произведение искусства

Не так давно был представлен проект tldraw — онлайн-сервис, который мгновенно преобразует рукотворные наброски сайтов в полноценный HTML-код. Это стало возможным благодаря объединению продвинутых инструментов для рисования и мощных алгоритмов компьютерного зрения.

Несмотря на то, что изначально tldraw позиционировался как инструмент для веб-разработчиков, он также открывает широкие возможности для творческого самовыражения.

Ваше рабочее место под угрозой, теперь точно — новости AI в дайджесте #6

Пользователь создает набросок будущей веб-страницы или рисунка прямо в окне браузера, затем этот набросок конвертируется в изображение и отправляется на обработку AI, который анализирует расположение и соотношение элементов на эскизе.

В результате формируется картинка или полноценная HTML-разметка веб-страницы, адаптированная под современные требования веб-дизайна. Весь интерфейс tldraw очень прост и интуитивно понятен — им может воспользоваться любой желающий, даже без специальных навыков верстки.

Сервис работает в связке со Stable Diffusion, которая в реальном времени улучшает нарисованное изображение, добавляет детали или исправляет ошибки. Пользователь задает направление, а AI помогает доработать детали.

Как часто у вас появляются мысли, что мы все ближе к сюжетам сериала «Черное зеркало»? Гуманоидные роботы, AI в очках и на флешке, no-code сайт по рисунку — прогресс AI технологий ускоряется с каждым годом и тормозить не планирует. Хорошо, что появился международный инструмент для его контроля, но пока без РФ. Писали об этом в прошлом дайджесте.

Если нужно сделать Level Up в работе, попробуйте мессенджер Compass. Для команды до 10 человек приложение бесплатное. Если пользователей больше 10, у нас есть бесплатный пробный период на 30 дней.

Читайте другие наши статьи:

4747
60 комментариев

Ого, теперь можно какую-то мазню от руки нарисовать и робот это превратит в шедевр абстракционизма? Не знала о таких новшествах, думала они только на вопросы отвечать умеют

4

Неожиданно увидеть такой комментарий от человека, который ведёт блог про генерацию изображений.
Да и использование женской формы глагола для человека по имени Алексей тоже необычно.

5

Чета Цукер продожает тупить. Зачем мне надписи к предметам, на которые я смотрю? Ченить более интересное нельзя придумать чтоли? Да хотябы нюдс-апп прикрутить, который всех голыми через очки сделает

3

Ахаха это уже за доп деньги можно будет докупить))) уже есть такие ИИ, которые всех раздевают, без артефактов

Да. Нужон рефайсер в час пик в метро

Мне вот одно непонятно, насколько быстро развиваются эти роботы? Не AI и чат-боты, а реальные физические работы. Вот у них есть теперь какие-то тактильные перчатки. Но мне казалось такие прототипы давно уже собирают. И как-то они не особо себя показывают. Времени много прошло — инноваций и действительной пользы для обычных людей от них мало. С такими темпами мы никогда не создадим себе этого домашнего помощника, который будет “ключ на 12” подность. Слабенькие они все

2

по Фрейду первые роботы будут не ключ на 12 подносить... ой не ключ )))