DIY编程器网

标题: 高效的C编程之: 浮点运算 [打印本页]

作者: admin    时间: 2014-10-10 07:23
标题: 高效的C编程之: 浮点运算
        14.10  浮点运算

        大多数的ARM处理器硬件上并不支持浮点运算。但ARM上提供了以下几个选项来实现浮点运算。
         
        ·  浮点累加协处理器FPA(Floating-Point Accelerator):ARM上提供了一组协处理器指令专门实现浮点运算。但这需要硬件支持,具体某一处理器上是否有FPA协处理器支持,可以查看ARM相关手册。
        ·  浮点运算仿真(FPE):使用软件仿真了FPA协处理器的执行。
        ·  浮点运算库(FPLib):使用ARM的浮点运算库函数实现程序中的浮点运算操作。这就意味着C编译器要把每一个浮点操作转换成一个子程序调用。C库中的子函数使用整型运算来模拟浮点操作。这些代码是用高效的汇编语言编写而成的。尽管如此,浮点运算执行起来还是要比相应整型运算慢得多。
         
                                                                         
                       
                                                                        注意
                       
                                                                        Thumb指令不支持协处理器指令,所以在Thumb状态下实现浮点运算,只能调用ARM浮点运算库。
                       
         
        为了在ARM上高效地实现浮点运算,请遵循以下规则。
        ·  避免使用浮点除法运算。通常情况下,除法运算的执行速度是普通加法或乘法运算速度的1/2。在无法避免除法的情况下,尽量使除法的除数为常数。如,x=x/3.0,可将其变为x = x * (1.0/3.0)。这样除数为常数(1.0/3.0),该值在编译阶段由编译器计算。
        ·  使用float型代替double型。float型要比double使用更少的内存和寄存器。
        ·  避免使用三角函数功能。实现三角函数功能,如sin、cos,使用了大量的乘加运算,它的运算速度大约是普通乘法运算的十倍。
        ·  当编译器处理浮点运算操作时,由于精度的影响很多优化不能实现。比如,表达式3 * (x / 3),编译器不能判断其值和x是等价的。所以在使用浮点运算表达式时,最好先人工的做一些必要的优化。




欢迎光临 DIY编程器网 (http://diybcq.com./) Powered by Discuz! X3.2