代码之家 › 专栏 › 技术社区 › Kari

性能:一次完成所有操作,或者每次操作循环几次?

caching performance c++

Kari · 技术社区 · 5 年前

它是 典型地 在迭代过程中,更快(为什么)同时执行所有指令?出于缓存的原因,这似乎是必要的。或者我们可以重复几次吗?

需要注意的是 count 很大(1000到1000 000)。

//original loop, wish to separate into several loops:
for(size_t i=0; i<10000000; ++i){
    floatVec_A[i] +=  floatVec_B[i] - floatVec_C[i]*floatVec_D[i];
    floatVec_A[i] = std::sin(floatVec_A[i]);
    //and so on
}

与我的愿望相反(但恐怕这可能是一个缓慢的方法 …通常 ?):

for(size_t i=0; i<10000000; ++i){
    floatVec_A[i] +=  floatVec_B[i];
}
for(size_t i=0; i<10000000; ++i){
    floatVec_A[i] += -floatVec_C[i]*floatvec_D[i];
}
for(size_t i=0; i<10000000; ++i){
    floatVec_A[i] = sin(floatVec_A[i]);
}
//and so on

我希望这样做,因为这些独立的循环可以被外观整洁的函数替换,使代码可读性更好。对我来说,这会让生活变得更轻松,因为实际上我在内部使用的是avx内部函数,为了方便起见,上面的代码被简化了。

myMath::add_toFirst( floatVec_A,  floatVec_B); 
myMath::mul_toThird( floatVec_C,  floatVec_D,  resultVec);
myMath::add_toFirst( floatVec_A,  resultVec);
myMath::sin(floatVec_A);
//and so on

一般来说 ,在后一种情况下,表演会受到影响吗?是小的还是大的,是因为哪些因素?

1 回复 | 直到 5 年前

Jason 5 年前

你的第一个例子…

//original loop, wish to separate into several loops:
for(size_t i=0; i<10000000; ++i){
    floatVec_A[i] +=  floatVec_B[i] - floatVec_C[i]*floatVec_D[i];
    floatVec_A[i] = std::sin(floatVec_A[i]);
    //and so on
}

会因为CPU缓存而表现最佳。

获取数据通常控制性能,第一个示例是最适合缓存的(线性的和可预测的)。出于这个原因,编译器实际上可能会将您的循环连接到一个循环中。

推荐文章

tincho87 · 避免Javascript/Css缓存

6 年前

Roman Puchkovskiy · 响应后缓存在nginx中不起作用

6 年前

Zac · 如何强制客户端重新下载我的网站?

7 年前

Khld Z. · 如何使用可变版本参数(可变参数)创建外部javascript链接

7 年前

Kumar · bitbake清理使用只读NFS SSTATE缓存失败

7 年前

James Skimming · 我可以从远程容器存储库“重新水化”docker build缓存吗?

7 年前

Chris Williams · 休眠/JPA缓存查找值

7 年前

user5747873 · 无法在WP Super Cache中启用缓存

7 年前

Nymeria · 仅绑定到当前事务的Spring缓存

7 年前

Nishabu · 如何使用本地主机和ISV客户端代理设置ISV本地缓存

7 年前