基于CUDA的Scharr算子并行化研究
打開文本圖片集
摘 要:傳統(tǒng)邊緣檢測算子采用逐行求梯度的方法順序進行,遇到圖像尺寸大或計算速度高效時,較難勝任這類計算密集度高的需求。文章從并行化角度對Scharr算子進行設計,采用CUDA語言對二維數(shù)據并行計算上進行算法優(yōu)化,提出了多線程塊偏移計算的設計思路,同時采取流處理的方式縮短傳輸開銷。實驗結果表明,與傳統(tǒng)Scharr算子相比,在7 000×7 000尺寸圖像識別上呈現(xiàn)了高效的識別速度,加速比提高了300倍左右,有較高的應用價值。(剩余5283字)