簡體 English 中英

如何並行優化大數據操作

[英]How to optimize large data manipulation in parallel

原文 2012-07-28 09:32:09 5 1 c++/ c/ multithreading

我正在開發一個C / C ++應用程序來以通用方式處理大量數據（聚合/選擇/轉換）。 我正在使用AMD Phenom II X4 965黑色版，所以有不同的緩存。

我已經開發了ST和MT版本的功能來執行所有單一操作，毫不奇怪，在最好的情況下，MT版本比ST快2倍，即使使用4個內核。

鑒於我是使用100％可用資源的粉絲，我很生氣只有2倍，我想要4倍。
出於這個原因，我已經花了相當多的時間使用-pg和valgrind ，使用緩存模擬器和調用圖。 該程序正在按預期工作，並且內核正在共享輸入過程數據（即應用於數據的操作），並且當不同的線程加載要處理的數據（數百萬個實體或行）時，報告緩存未命中（如預期的那樣）。如果現在你知道我想要做什么:-)）。 最后我使用了不同的編譯器，g ++和clang ++，- O3兩者，性能相同。

我的結論是，由於需要處理大量數據（GB數據），因此最終必須在CPU中加載數據，這是真正的等待時間。 我可以進一步改進我的軟件嗎？ 我達到了極限嗎？

我在Linux x86-64，Ubuntu 11.10上使用C / C ++。 我全都耳朵！ :-)

1 個解決方案

它是什么類型的應用程序？ 你能告訴我們一些代碼嗎？

正如我評論的那樣，您可能已達到一些硬件限制，如RAM帶寬。 如果你這樣做，沒有軟件技巧可以改善它。

您可以使用MPI，OpenMP或OpenCL（在GPU上）進行調查，但如果不了解您的應用程序，我們將無法提供幫助。

如果使用GCC進行編譯並且如果您想幫助處理器緩存預取，請考慮小心使用和簡化__builtin_prefetch （但使用它太多或太糟糕會降低性能）。

如何優化大數據字符串的串行通信？

[英]How do I optimize serial communication for large data strings?

如何優化C ++對象I / O操作的性能？

[英]how to optimize performance for C++ object I/O manipulation?

如何優化大分散點集的插值？

[英]How to optimize interpolation of large set of scattered points?

如何優化大內存數據庫的分頁

[英]How to optimize paging for large in memory database

如何優化 n-queens OpenMP 並行程序？

[英]How to optimize a n-queens OpenMP parallel program?

使用並行I / O復制大數據文件

[英]Copy large data file using parallel I/O

如何針對輸入的大量字符串優化我的代碼

[英]How can I optimize my code for large number of strings on input

如何針對大量整數優化C ++ / C代碼

[英]how to optimize C++/C code for a large number of integers

如何優化這種簡單的數據（事件）轉換類？

[英]How to optimize such simple data (event) casting Class?

如何優化解析數據流算法？

[英]How to optimize parse data flow algorithm?

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 如何優化大數據字符串的串行通信？如何優化C ++對象I / O操作的性能？如何優化大分散點集的插值？如何優化大內存數據庫的分頁如何優化 n-queens OpenMP 並行程序？使用並行I / O復制大數據文件如何針對輸入的大量字符串優化我的代碼如何針對大量整數優化C ++ / C代碼如何優化這種簡單的數據（事件）轉換類？如何優化解析數據流算法？

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM