Как-то в разговоре со знакомым я услышал, что его компания постоянно парсит отчеты Similarweb и Alexa, чтобы находить «летящие» проекты, готовые к копированию. Постоянно идет анализ сайтов в топе и затем отчеты сравниваются, анализируются сайты, которые прыгнули выше других в посещаемости.
Попробуйте просто спарсить инфу по сайтам за счет a-parser или других парсеров адекватных, это значительно облегчит вашу жизнь=)