{"id":14290,"url":"\/distributions\/14290\/click?bit=1&hash=bece6ae8cf715298895ba844b6416416882fe02c5d18dab2837319deacd2c478","title":"\u041a\u043e\u0440\u043f\u043e\u0440\u0430\u0446\u0438\u0438 \u043a\u0430\u043a \u043d\u0438\u043a\u043e\u0433\u0434\u0430 \u0440\u0430\u043d\u044c\u0448\u0435 \u0445\u043e\u0442\u044f\u0442 \u0441\u043e\u0442\u0440\u0443\u0434\u043d\u0438\u0447\u0430\u0442\u044c \u0441 \u043c\u0430\u043b\u044b\u043c \u0431\u0438\u0437\u043d\u0435\u0441\u043e\u043c","buttonText":"","imageUuid":""}

Инженер собрал прототип камеры без объектива, которая создаёт изображения с помощью ИИ и параметров времени и места Статьи редакции

Есть физическое устройство и сайт, где можно сделать «снимок».

  • Проект Бьорна Карманна называется Paragraphica. Камера предлагает «способ познания окружающего мира, который не ограничивается только визуальным восприятием».
  • Paragraphica использует данные о местоположении и искусственный интеллект для визуализации определенного места в конкретный момент. Карманн запустил сайт, на котором можно протестировать технологию.
  • Камера с помощью открытых API собирает данные о местоположении — адрес, погоду, время суток и близлежащие места. Объектива нет, устройству нужен доступ в интернет. На дисплее с обратной стороны отображаются полученные данные. С помощью API преобразования текста в изображение камера создаёт визуализацию.
Здесь и далее слева: снимок местоположения камеры; посередине: данные о местоположении; справа: изображение, созданное ИИ
  • На камере есть три физических крутящихся регулятора для настройки части параметров запроса, который получит ИИ. С помощью первого можно определить радиус в метрах, в пределах которого алгоритм будет искать объекты, чтобы подставить их в промпт (текстовое описание для генерации картинки) — например, «парковка» или «студия йоги». Это своеобразное фокусное расстояние линзы.
  • Второй позволяет выбрать зерно случайной последовательности: такое число, с помощью которого нейросеть генерирует случайные числа, когда они ей нужны. Если выставить определённое значение, получить картинку и не менять его при генерации следующей с таким же промптом — результат изменится, но будет в целом похож на предыдущий. Автор изобретения сравнивает поворот регулятора со сменой зернистости на кадре плёночного фотоаппарата.
  • Третий регулятор ограничивает «свободу» алгоритмов при выполнении запроса — это то, насколько ИИ вправе или, наоборот, не может отклоняться от пользовательского промпта. Как если бы фотограф настраивал резкость или размытость будущего изображения.
  • Карманн использовал для физического прототипа Raspberry Pi 4, сенсорный экран, напечатанный на 3D-принтере корпус, а для ПО — Noodl и Stable Diffusion API.
0
163 комментария
Написать комментарий...
Антон Давыдов

Звучит и безумно и гениально одновременно. Непонятно зачем это вообще, но выглядит потрясающе. Объектив, или как это назвать, выглядит как ребёнок Чужого, надеюсь не будет также на лица людей прыгать на улицах под устрашающую музыку. Будущее из старых фильмов приходит и это отлично как по мне. Здорово будет если слепым можно будет внедрять что-то похожее, много проблем решит, главное чтобы без сбоев, нужно долго тестировать чтобы не навредить. Жду когда с такой штукой можно будет смотреть через стены как фантасты предсказывали.
Напомнили в комментариях про миелофон - вот это ностальгия бесконечная напала.
Смешит что люди говорят что это не настоящие фотографии, но мозг же также перешифровывает то что мы, якобы, видим, в действительности всё что мы "видим" выглядит не так.

Ответить
Развернуть ветку
Alex Gunt

Дядь, что с тобой?

Ответить
Развернуть ветку
160 комментариев
Раскрывать всегда