Самым заметным экземпляром считается объект, которому принадлежит центральный пиксель выделенной области, поэтому даже если сцена переполнена объектами, модель может идентифицировать экземпляр, который нужно сегментировать. Эта бинарная задача сегментации для разных классов и типов экземпляров позволяет модели хорошо обобщать предсказания на новые классы и классификации. На самом деле, мы можем переносить предсказания не только между объектами одного класса, например, между легковыми автомобилями в разных странах, но и между совершенно разными классами, например, от автомобилей к мотоциклам, а затем к дорожным знакам. Такой перенос можно обеспечить частичным переобучением или, в некоторых случаях, вообще без него.