2
1
首先:全局(GPU)内存和纹理的区别是由缓存定义的。纹理有它,全局内存-没有。 第二:对于纹理和全局内存,从主机到(GPU)设备的传输速率是相同的。 第三:从主机到(GPU)设备的传输速率随GPU的生成而变化,并由PCI Express总线和数据大小决定。 例如,请参见: http://www.accelereyes.com/wiki/index.php?title=GPU_Memory_Transfer |
3
0
您可以使用CUDA配置文件告诉您在CUDA函数中花费的时间,包括内存传输时间。您可以编写非常简单的传输测试用例并对其进行度量。在我看来,当您测量您的特定测试用例时,这会更好。 查找cuda_配置文件及其使用方法。 http://www.drdobbs.com/cpp/209601096?pgno=2 你的问题有点难理解,你想测量主机和GPU之间的传输(纹理缓存实际上与之无关)还是内核内部的纹理读取? |