{"id":14287,"url":"\/distributions\/14287\/click?bit=1&hash=1d1b6427c21936742162fc18778388fc58ebf8e17517414e1bfb1d3edd9b94c0","title":"\u0412\u044b\u0440\u0430\u0441\u0442\u0438 \u0438\u0437 \u0440\u0430\u0437\u0440\u0430\u0431\u043e\u0442\u0447\u0438\u043a\u0430 \u0434\u043e \u0440\u0443\u043a\u043e\u0432\u043e\u0434\u0438\u0442\u0435\u043b\u044f \u0437\u0430 \u0433\u043e\u0434","buttonText":"","imageUuid":""}

Инженер собрал прототип камеры без объектива, которая создаёт изображения с помощью ИИ и параметров времени и места Статьи редакции

Есть физическое устройство и сайт, где можно сделать «снимок».

  • Проект Бьорна Карманна называется Paragraphica. Камера предлагает «способ познания окружающего мира, который не ограничивается только визуальным восприятием».
  • Paragraphica использует данные о местоположении и искусственный интеллект для визуализации определенного места в конкретный момент. Карманн запустил сайт, на котором можно протестировать технологию.
  • Камера с помощью открытых API собирает данные о местоположении — адрес, погоду, время суток и близлежащие места. Объектива нет, устройству нужен доступ в интернет. На дисплее с обратной стороны отображаются полученные данные. С помощью API преобразования текста в изображение камера создаёт визуализацию.
Здесь и далее слева: снимок местоположения камеры; посередине: данные о местоположении; справа: изображение, созданное ИИ
  • На камере есть три физических крутящихся регулятора для настройки части параметров запроса, который получит ИИ. С помощью первого можно определить радиус в метрах, в пределах которого алгоритм будет искать объекты, чтобы подставить их в промпт (текстовое описание для генерации картинки) — например, «парковка» или «студия йоги». Это своеобразное фокусное расстояние линзы.
  • Второй позволяет выбрать зерно случайной последовательности: такое число, с помощью которого нейросеть генерирует случайные числа, когда они ей нужны. Если выставить определённое значение, получить картинку и не менять его при генерации следующей с таким же промптом — результат изменится, но будет в целом похож на предыдущий. Автор изобретения сравнивает поворот регулятора со сменой зернистости на кадре плёночного фотоаппарата.
  • Третий регулятор ограничивает «свободу» алгоритмов при выполнении запроса — это то, насколько ИИ вправе или, наоборот, не может отклоняться от пользовательского промпта. Как если бы фотограф настраивал резкость или размытость будущего изображения.
  • Карманн использовал для физического прототипа Raspberry Pi 4, сенсорный экран, напечатанный на 3D-принтере корпус, а для ПО — Noodl и Stable Diffusion API.
0
163 комментария
Написать комментарий...
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Артём А.

Чтобы комнату проветрить

Ответить
Развернуть ветку
160 комментариев
Раскрывать всегда