[英]How to write same value to consecutive locations in x86
我需要使用x86機器內在高效地實現以下代碼。 有人可以提出解決方案嗎?
uint64_t array[8];
array[0] = SOME_VALUE;
array[1] = SOME_VALUE;
array[2] = SOME_VALUE;
array[3] = SOME_VALUE;
array[4] = SOME_VALUE;
array[5] = SOME_VALUE;
array[6] = SOME_VALUE;
array[7] = SOME_VALUE;
由於相同的值被寫入連續的位置,如果vector / SSE內在函數可以有效地執行,我想嘗試一下。
雖然我不了解向量/ SSE指令,但我發現有時查看生成的代碼會顯示編譯器知道最佳機器代碼,並且您會發現它已經生成了您希望的內容。 值得查看生成的代碼。
使用memset
。 glibc將為您完成優化。 如果您認為自己可以做得更好,則應該向郵件列表提交補丁。
此外,“指令速度”不太可能是這里的瓶頸。 這可能是內存帶寬。 不幸的是,除了“少讀取內存”之外,沒有什么可以降低它的靈丹妙葯。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.