采用此控制策略消除因片外的数据存取瓶颈而引起的DSP内核等待。DSP实时仿真表明,经这种流程优化,运动搜索部分运算时间下降了近1/3.另外,为进一步加快运动搜索的速度,对原搜索算法中的运动矢量预测进行改进。原搜索算法5个候选矢量的选择仅利用物体运动的空间连续性。
在改进的运动矢量预测中,利用运动时间连续性增加1个候选矢量。根据运动惯性,前一帧中与当前帧当前块位置相同的对应块周围有8个块,沿着各自的运动矢量运动后与当前块重合的可能性大。因此,选择8个块中运动后与当前块重合最多的块的运动矢量作为当前块运动矢量的第6个候选矢量。经改进后,对foreman图像序列测试统计,85%以上的块搜索次数小于6次,即绝大多数块会在6个候选矢量中找到最佳匹配,而不用进行菱形搜索,运算量大大减少。
汇编代码优化Blackfin处理器具有强大的并行处理能力,一条32位长的乘加指令可以和2条16位长的算术指令或LOAD/STORE指令同时执行。这就可以在CPU对当前数据进行操作的同时,从存储器中取出下次运算所需的操作数,以减少处理器内核的等待时间,提高内核资源的使用率。