Что касается о построении сумматоров, думаю стоит почитать XAPP018, хоть он и для старого семейства, но в качестве теории подойдет. Там приводится формула для расчета получаемых задержек, только для Virtex подставляются немного другие времена (можешь посмотреть отчет Timing Analyzer). Там же приводится альтернативное построение сумматоров, с целью увеличения быстродействия.
На счет объема проекта, необходимо учитывать не только фак увеличения времени на Implemenation, но и возрастаемое потребление тока ядром. Кстати, это могло стать причиной сбоев. Типичный проект (50% FFS, 50% LUT, 15% Int Toggle) на 100 МГц для кристалла XCV300E требует около 600 мА, для XCV600E - почти 1.4 А. Так что, проверь источник на возможность выдачи требуемого тока для твоего проекта. Возможное потреблении можно оценить, воспользовавшись XPower или Power Estimator.
Для обычного проекта достаточно использовать один тактовый вход или два, если требуется Feedback от внешней тактовой, используемой, например, для работы с микросхемами SDRAM.
На последок, прикрепляю к письму XAPP018 и Power Estimator for Virtex.