c++ - 如何使用DSP加速OMAP上的代碼？

編輯：

GPP應用程序分配大小為0x1000字節的緩沖區。

GPP應用程序調用DSPProcessor_ReserveMemory為每個分配的緩沖區保留DSP虛擬地址空間，使用比分配的緩沖區大4K的大小來考慮自動頁面對齊。 總預留大小也必須沿4K頁面邊界對齊。

GPP應用程序調用DSPProcessor_Map將每個分配的緩沖區映射到上一步中保留的DSP虛擬地址空間。

GPP應用程序准備一條消息，通知DSP執行階段虛擬地址空間的基地址，該地址已映射到GPP上分配的緩沖區。 GPP應用程序使用DSPNode_PutMessage將消息發送到DSP。

GPP調用memcpy將要處理的數據復制到共享內存中。

GPP應用程序調用DSPProcessor_FlushMemory以確保已刷新數據高速緩存。

GPP應用程序准備一條消息，通知DSP執行階段已完成寫入緩沖區，DSP現在可以訪問緩沖區。 該消息還包含寫入緩沖區的數據量，以便DSP知道要復制的數據量。 GPP使用DSPNode_PutMessage將消息發送到DSP，然后調用DSPNode_GetMessage等待從DSP聽回消息。

在這些之后，DSP程序的執行開始，並且DSP在完成處理時通過消息通知GPP。 只是為了嘗試我不在DSP程序中進行任何處理。 我只是將“處理完成”消息發送回GPP。 這仍然需要耗費大量時間。 可能是因為內部/外部內存使用，還是因為通信過載？