Цитата(MicrowaveDesigneR @ Feb 14 2010, 14:32)

Во-вторых, математические операции будут выполняться быстрее в MATLAB'е на 64 разрядной версии ОС, т.к. числа, с которыми он работает, уже без проблем могут быть занесены в регистр процессора без разбивки (все-таки регистр в 2 раза больше). Да и доступно теперь в процессорах, поддерживающих архитектуру x64, больше регистров общего назначения + дополнительные регистры.
Второе сомнительно. Обе архитектуры (x32 и x64) считают на флоат-поинтах одинаково, т.к. у них FPP (float point processor) одинаков. А новый MatLab практически всю арифметику проворовачивает не в целых числах, а во флоатах, а там специализированные регистры (одной и той же длины в обеих архитектурах). В регистрах общего назначения флоат-числа сроду не хранились, не умеют те регистры с ними оперировать.
А нынче MatLab переписали под SSE (SSE-2,3,4...) с которым компилятор легко обходится, когда как до того, использовался FPP стековой архитектуры (x87), из-за чего компилятор каждый раз передавливал промежуточные результаты в память. Вручную его запрограммировать так, чтобы промежуточные результаты в стеке держал, было можно, но для компилятора крайне сложно, т.к. в процессе вычислений глубина погружения постоянно меняется. На SSE-регистрах все делается примитивно просто, т.к. они по обращению разные. Из-за этого на SSE можно скомпилировать вычисление какой-нибудь сложной формулы быстрее, т.к. промежуточные результаты можно оставлять во флоат-регистрах, где они и были получены. А по мере необходимости проводить с ними арифметические операции напрямую (x87 может оперировать только верхушкой стека). Из-за этого экономится много операций по загрузке и чтению в память. А такие операции накладны, т.к. размерность числа там 64 бита. ... Я сама долгое время возилась с ускорением матричных операций, а потому знаю, наколько сильно скорость вычислений зависит от многих иных обстоятельств, от типа архитектуры мало зависимых. Например, достаточно выравнить расположение масива флоат-данных на адрес, кратный 16-ти байт, чтобы скорость расчетов возрасла в полтора раза только за счет особенностий организации памяти.
Если x64 и может иметь здесь какое-либо преимущество над x32, то разве что в возможности записывать флоат-число в память и читать его оттуда за один такт (или за меньшее число тактов, чем в x32). Но это уже скорее относится к ширине шины, которая соединяет CPU и памятью (кэшем?). В этом вопросе я не сильна и ничего определенного сказать не могу.