Обычно достаточно одной структуры для проверки всех гипотез. Чтобы сравнить разные названия для одной категории, можно расположить их все в одном дереве и сравнить количество нажатий по каждомуу. Если решите тестировать два варианта структуры, показывайте респонденту только один из них, иначе результат может быть некорректным. Например, первой половине пользователей покажите вариант 1, второй половине — вариант 2.