1
2
这是关于
也不
看见 Can x86's MOV really be "free"? Why can't I reproduce this at all? 有关前端/后端吞吐量瓶颈与延迟的更多信息。 您可能会看到代码对齐的一些副作用,或者像中一样的时髦的Sandybridge家族商店转发延迟效应 Adding a redundant assignment speeds up code when compiled without optimization 因为您也在禁用优化的情况下编译,所以让编译器生成反优化代码以进行一致性调试,从而将循环计数器保留在内存中。(~6个循环循环通过存储/重新加载来承载依赖链,而不是普通小循环的每个时钟1次迭代。) 如果你的结果在更大的迭代次数下是可复制的,那么你所看到的可能有一些微体系结构的解释,但它可能与你试图测量的任何东西都没有关系。
当然,你还需要解决这个问题
|
Anon. · 用汇编语言解释这一行? 6 年前 |
wangt13 · 如何使用VMX暂停和恢复VM 6 年前 |
Kay · Skylake和更新的环形巴士 6 年前 |
Kadir · Intel芯片上的半精度浮点算法 6 年前 |
Some_Dude · x86汇编牛顿平方根算法寄存器为1#IND 6 年前 |