Re: [問題] CUDA關於shared memory的使用

看板C_and_CPP作者a88258850 (資源回收將軍)時間14年前 (2010/08/04 18:25)推噓2(2推 0噓 8→)

留言10則, 4人參與討論串1/1

※ 引述《a88258850 (資源回收將軍)》之銘言： ( *[1m *[m 為色碼，可以按 Ctrl+V 預覽會顯示的顏色 ) ( 未必需要依照此格式，文章條理清楚即可 ) 遇到的問題： (題意請描述清楚) 我希望shared memory宣告的array，可以讓我當變數傳進另外宣告的devicefunction... 不知道這種作法的問題在哪邊? 以下是我的程式... __device__ void test(float *t) { .............. } __global__ void kernel( float total) { __shared__ float t[25]; int total_task = blockDim.x * gridDim.x; int task_sn = blockIdx.x * blockDim.x + threadIdx.x; for(int k=task_sn; k <total ;k+=total_task) { test(t); } } int main() { kernel<<<(1,Threads)>>>(total) } 程式跑出來的錯誤結果：假如我假設Threads = 32，那程式可以正常跑完沒問題。但，Threads >=64以後，程式會卡住... 開發平台： (例: VC++ or gcc/g++ or Dev-C++, Windows or Linux) linux 板子是Tesla C2050，每個block有49152 bytes的shared memory；若設定64個thread，每個thread大概有768bytes = 192個float，謝謝幫忙解答。 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.113.90.80

→

a88258850

08/04 18:09,

08/04 18:09

推

bill42362

08/04 18:10,

08/04 18:10

→

bill42362

08/04 18:11,

08/04 18:11