Qual o compilador (toolchain) que voce esta usando?
Qual processador target?
Nao vai ganhar quase nada usando a hardfp ABI.
Voce pode usar o VFP usando softfp ABI mesmo.
Ou entao tem como usar o NEON que eh mais rapido que o VFP para float de precisao simples.
Quando me responder as perguntas e eu tiver no meu computador vou ver os parametros exatos.
Alem disso, tem como mandar o GCC gerar codiso assembly para ver quais instrucoes ele ta gerando (soft, VFP, ou NEON).