[英]tree vectorization: gcc optimization flag
我注意到gcc標志-ftree-vectorize
對於優化代碼非常有用。
我試圖更好地理解它是如何工作的,但是該文檔相當簡潔:
在樹上執行矢量化。 如果未明確指定,則此標志啟用-ftree-loop-vectorize和-ftree-slp-vectorize。
有人知道這個標志的內部運作方式嗎?
樹是GCC使用的內部代碼表示形式,並且樹矢量化在此階段進行。 在這種表示形式中,很容易發現重復的指令。 如果代碼生成器可以發出SIMD指令,則有助於在樹級中捆綁這些重復的指令。
有關詳細信息,請參見tree-vectorizer.c。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.