Эксперименты 🐱
Вчера мне попалась в ленте стереограмма (magic eye).
У меня в детстве было две такие книжки, это был мой первый опыт дополненной реальности, думаю они сильно повлияли на мой профессиональный путь, и мне стало интересно протестировать Nano Banana 2 и GPT Image 2, и проверить, умеют ли они создавать такие картинки?
- Сгенерил промпт:
A Magic Eye / SIRDS-style autostereogram. The entire image is filled edge-to-edge with a dense, seamless, uniformly distributed repeating micro-pattern of tiny colorful cartoon dogs, paw prints, bones, and dog collars — all elements must be small, equal in size, and spread with completely uniform density across the whole image. There must be NO visible silhouette, NO dark outline, NO shadow, NO tonal overlay, NO burned-in shape of any dog or bicycle anywhere in the visible image. The pattern must look 100% uniform — no region should be darker, lighter, or different in any way. The hidden 3D object (a dog riding a bicycle) is encoded ONLY through subtle horizontal pixel-shift variations in the repeating pattern, invisible to the naked eye, and only perceivable when the viewer diverges or relaxes their eyes. The background is black. The style is exactly like a 1990s Magic Eye book page. Do not draw any dog or bicycle as a visible element. Do not composite or overlay any shape on top of the pattern.
- Отдал его GPT Image 2 и Nano Banana 2 (последней включил Google поиск grounding)
- Далее было 3 итерации правок для каждой модели с уточнением контекста, после чего получились вот эти две картинки
Стерео-эффект есть на каждой, но, как видите, визуально с самой стартовой картинкой одна модель справилась очень плохо. Тут есть явный лидер, хотя даже у него сама стереокартинка выдает нечеткий результат.
Догадаетесь где какая модель поработала? 🤖💬
Подписывайтесь на Telegram Точки над ИИ.