Будем считать что я осознал и раскаялся... (хотя разницу с массивом считаю надуманной)
Вот что пишут в Procedure Call Standard for the ARM Architecture.
5.4 Result Return
The manner in which a result is returned from a function is determined by the type of that result.
For the base standard:
A Half-precision Floating Point Type is converted to single precision and returned in r0.
A Fundamental Data Type that is smaller than 4 bytes is zero- or sign-extended to a word and returned in r0.
A word-sized Fundamental Data Type (e.g., int, float) is returned in r0.
A double-word sized Fundamental Data Type (e.g., long long, double and 64-bit containerized vectors) is
returned in r0 and r1.
A 128-bit containerized vector is returned in r0-r3.
A Composite Type not larger than 4 bytes is returned in r0. The format is as if the result had been stored in
memory at a word-aligned address and then loaded into r0 with an LDR instruction. Any bits in r0 that lie
outside the bounds of the result have unspecified values.
A Composite Type larger than 4 bytes, or whose size cannot be determined statically by both caller and
callee, is stored in memory at an address passed as an extra argument when the function was called (§5.5,
rule A.4). The memory to be used for the result may be modified at any point during the function call.
Цитата(SM @ Feb 9 2015, 12:11)

Ну вот именно так они и сделали! Оператор "return" сохраняет ее в этой самой, (локальной, глобальной) переменной. Что не нравится-то?
Чтобы использовать структуру, выданную из функции, ее нужно вручную присвоить своей.
Я же не могу выполнить, например, следующее:
myStruct.a = func(...).a;
А сначала
myStruct = func(...);
потом работать с членами myStruct.
Или при возврате структура останется в тех же регистрах, и будет считаться уже myStruct?