Сам бот состоит из двух нейронных сетей: одна описывает изображение, а другая пытается сгенерировать к нему смешную подпись. На данный момент создаётся третья нейросеть — ранжировщик сгенерированых подписей. Также на данный момент бот не понимает текст на изображениях, что будет исправлено в будущем.