代码之家  ›  专栏  ›  技术社区  ›  Anchal Khandelwal

Intel Xeon E5-2670 v2计算GFlop

  •  0
  • Anchal Khandelwal  · 技术社区  · 9 年前

    如何计算处理器的GFlops:Intel Xeon E5-2670 v2 时钟速度:2.5 GHz vCPU:2 内存:7.5 GiB 存储:1*32 SSD 网络性能:中等(500 Mbps)

    它的aws实例类型:m3.large 我无法找到IPC并计算GFlop,所以我可以估计我的成本。 任何帮助都会很好。

    1 回复  |  直到 9 年前
        1
  •  0
  •   Peter Cordes    9 年前

    Xeon E5 xxxx v2是常春藤桥核心,因此不支持FMA。看见 Agner Fog's microarch pdf 了解IvyBridge管道的详细信息。

    如果您设法避免任何内存瓶颈 IvB可以维持每个时钟两个AVX矢量FP操作的吞吐量。执行端口1可以运行 vmulps vaddps ,但执行端口0只能运行 vmulps .

    因此:2.5G时钟/秒*2 FP矢量/时钟*8单精度元素/矢量

    因此:单精度40GFlop/sec理论最大值,使用AVX 256b矢量。双精度:20GFlop/sec(每256b矢量4个DP元素)。

    请注意,即使从一级缓存,IvB也只有128b个加载/存储数据路径,并且只能支持2个加载和一个存储 每2 256b矢量的时钟。

    mul有5c延迟,add有3c延迟,因此您需要足够的指令级并行性来保持5或10次乘法。