(function(m,e,t,r,i,k,a){m[i]=m[i]||function(){(m[i].a=m[i].a||[]).push(arguments)}; m[i].l=1*new Date(); for (var j = 0; j < document.scripts.length; j++) {if (document.scripts[j].src === r) { return; }} k=e.createElement(t),a=e.getElementsByTagName(t)[0],k.async=1,k.src=r,a.parentNode.insertBefore(k,a)}) (window, document, "script", "https://mc.yandex.ru/metrika/tag.js", "ym"); ym(93256750, "init", { defer: true, clickmap:true, trackLinks:true, accurateTrackBounce:true }); ym(93256750, 'hit', window.location.href);

Ваше рабочее место под угрозой, теперь точно — новости AI в дайджесте #6

Хайп вокруг автобота Маска, Ray-Ban всегда в моде, Apple наконец-то вошел в гонку и на десерт: 2 крутые AI-фичи. Подробности в дайджесте (с видео).

Хеллоу, vc.ru! С вами команда корпоративного мессенджера Compass.

Подготовили для вас шестой выпуск еженедельного дайджеста с новостями в мире AI.

Optimus Gen-2

Tesla представила второе поколение своего гуманоидного робота Optimus. Робот пока ничем серьезным не занят — танцует, гуляет и двигает коробки. Но это не весь его потенциал.

На видео Optimus Gen-2 демонстрирует движения более приближенные к человеческим, чем его предыдущая версия. Он похудел на 10 кг и ходит на 30% быстрее — шансов на то, что он вас догонит и не упадет стало больше.

Главное отличие от других гуманоидных роботов — новые руки с тактильными датчиками на кончиках пальцев. Благодаря им робот может брать и аккуратно переносить хрупкие вещи, например, яйцо. Теперь понятно почему цены на них так взлетели — тысячи яиц ушли на отладку бота.

Фанаты «Detroit: Become Human» знают, к чему все идет: через 5-7 лет Optimus возьмет на себя домашнюю рутину, подаст Петровичу ключ на 12 и вполне себе вольется в социум. Не удивляйтесь, если этот Tesla-boy займет ваше рабочее место через 10 лет, а потом внезапно начнет искать Иерихон.

Optimus Gen-2 показывает значительный прогресс в области роботостроения. Отечественные специалисты стараются не отставать. Например, инженеры НИИ механики МГУ активно дорабатывают своего шагающего четырехногого робота и совсем скоро дадут жару Boston Dynamics. Осталось дождаться, когда роботы в РФ будут также круто танцевать, как Optimus.

Ray-Ban с AI на борту

Meta* представила обновление для своих умных очков Ray-Ban Meta collection. Теперь в очки интегрирован мультимодальный искусственный интеллект, который может распознавать объекты вокруг и реагировать на голосовые команды.

* Компания Meta признана экстремистской организацией на территории Российской Федерации

Благодаря камерам и микрофонам очки теперь могут идентифицировать предметы, описывать то, на что смотрит пользователь, предлагать подписи к фотографиям. Например, можно попросить очки подобрать пару брюк к рубашке или перевести текст с иностранного языка.

Также есть интеграция с поисковиком Bing — можно задавать вопросы об актуальных новостях, погоде, ресторанах поблизости. Всё это делается голосовыми командами через виртуального помощника Meta AI.

В очках 32 ГБ памяти, сверхширокоугольная камера 12 МП и подключение к телефону через приложение Meta View. Стоимость — 300$. Время автономной работы — до 6 часов.

Но во всем есть своя цена. Корпорации будут получать инфу для таргета не только от вашего iPhone, а «товарищ майор» посмотрит на мир вашими глазами.

Apple AI Framework

Apple выпустила MLX — фреймворк для машинного обучения и библиотеку моделей MLX Data. Это инструменты для разработки AI-приложений на базе чипов Apple.

MLX — это программное обеспечение для обучения языковых и генеративных AI-моделей, таких, как Llama и Stable Diffusion. Оно работает исключительно на чипах Apple Silicon.

MLX Data — это готовые наборы данных для обучения, которые также оптимизированы для чипов Apple. Можно все скачать на github.

С помощью этих инструментов можно создавать приложения с AI на борту для экосистемы Apple. Возможно даже получится создать эмулятор x86 на ARM архитектуре и погонять в Cyberpunk 2077 на Mac без лагов и вылетов.

Это важный шаг Apple в сфере AI. Компания долго не проявляла активности в этой области, а теперь нас ждет бум AI-приложений в App Store. В долгосрочной перспективе может появлиться «сильный» ассистент, интегрированный в устройства Apple. Прости, Siri.

Llamafile. AI на флешке

Компания Mozilla представила новый open-source проект под названием Llamafile.

Llamafile преобразует базы данных нейросетей, таких, как Mistral-7B-Instruct или WizardCoder-Python-13B, в исполняемый файл. Теперь «голую» AI можно запустить в пару кликов на популярных операционных системах, например, macOS, Windows, Linux, без необходимости установки дополнительного ПО.

Проект создан на основе двух популярных open source решений:

  • llama.cpp — framework для создания чат-ботов на основе нейросетевых моделей.
  • Cosmopolitan Libc — библиотека для кроссплатформенной разработки на Си.

Благодаря объединению этих проектов удалось создать универсальный формат исполняемых файлов, который поддерживает как CPU, так и GPU-вычисления и может запускаться на широком спектре устройств.

По заявлению Mozilla, Llamafile должен существенно упростить распространение нейросетевых чат-ботов среди обычных пользователей. Например, чат-бот можно загрузить на флешку и использовать на разных ПК, вся информация будет храниться только на флешке. Llamafile распространяется под лицензией Apache 2.0, что делает его полностью открытым для модификаций и улучшений со стороны сообщества.

tldraw. Превращаем наброски в HTML-код или произведение искусства

Не так давно был представлен проект tldraw — онлайн-сервис, который мгновенно преобразует рукотворные наброски сайтов в полноценный HTML-код. Это стало возможным благодаря объединению продвинутых инструментов для рисования и мощных алгоритмов компьютерного зрения.

Несмотря на то, что изначально tldraw позиционировался как инструмент для веб-разработчиков, он также открывает широкие возможности для творческого самовыражения.

Пользователь создает набросок будущей веб-страницы или рисунка прямо в окне браузера, затем этот набросок конвертируется в изображение и отправляется на обработку AI, который анализирует расположение и соотношение элементов на эскизе.

В результате формируется картинка или полноценная HTML-разметка веб-страницы, адаптированная под современные требования веб-дизайна. Весь интерфейс tldraw очень прост и интуитивно понятен — им может воспользоваться любой желающий, даже без специальных навыков верстки.

Сервис работает в связке со Stable Diffusion, которая в реальном времени улучшает нарисованное изображение, добавляет детали или исправляет ошибки. Пользователь задает направление, а AI помогает доработать детали.

Как часто у вас появляются мысли, что мы все ближе к сюжетам сериала «Черное зеркало»? Гуманоидные роботы, AI в очках и на флешке, no-code сайт по рисунку — прогресс AI технологий ускоряется с каждым годом и тормозить не планирует. Хорошо, что появился международный инструмент для его контроля, но пока без РФ. Писали об этом в прошлом дайджесте.

Если нужно сделать Level Up в работе, попробуйте мессенджер Compass. Для команды до 10 человек приложение бесплатное. Если пользователей больше 10, у нас есть бесплатный пробный период на 30 дней.

Читайте другие наши статьи:

0
61 комментарий
Написать комментарий...
Neuromarket (Алексей)

Ого, теперь можно какую-то мазню от руки нарисовать и робот это превратит в шедевр абстракционизма? Не знала о таких новшествах, думала они только на вопросы отвечать умеют

Ответить
Развернуть ветку
Labeling

Неожиданно увидеть такой комментарий от человека, который ведёт блог про генерацию изображений.
Да и использование женской формы глагола для человека по имени Алексей тоже необычно.

Ответить
Развернуть ветку
alexsun

бот сломался :))

Ответить
Развернуть ветку
Анна Келсо

правильнее будет сказать бот порвался))

Ответить
Развернуть ветку
Neuromarket (Алексей)

У вас есть опыт? Поделитесь, каково это ;).

Ответить
Развернуть ветку
Анна Келсо

в смысле ботов рвать?)) здесь особого умени не нужно

Ответить
Развернуть ветку
Neuromarket (Алексей)

Это сарказм, если что был ). Ну а в глаголе уж за опечатку извините.

Ответить
Развернуть ветку
Отнюдь

ого, боты умеют в сарказм

Ответить
Развернуть ветку
Neuromarket (Алексей)

Боты не умеют. И тролли не умеют. Но умеют только тупо по клавишам клацать (и зубами от злости )))

Ответить
Развернуть ветку
58 комментариев
Раскрывать всегда