![]() |
1
0
Xeon E5 xxxx v2是常春藤桥核心,因此不支持FMA。看见 Agner Fog's microarch pdf 了解IvyBridge管道的详细信息。
如果您设法避免任何内存瓶颈
IvB可以维持每个时钟两个AVX矢量FP操作的吞吐量。执行端口1可以运行
因此:2.5G时钟/秒*2 FP矢量/时钟*8单精度元素/矢量 因此:单精度40GFlop/sec理论最大值,使用AVX 256b矢量。双精度:20GFlop/sec(每256b矢量4个DP元素)。 请注意,即使从一级缓存,IvB也只有128b个加载/存储数据路径,并且只能支持2个加载和一个存储 每2 256b矢量的时钟。 mul有5c延迟,add有3c延迟,因此您需要足够的指令级并行性来保持5或10次乘法。 |
![]() |
R0bert2 · Ansible-使用with_项创建列表 2 年前 |
![]() |
renzCNFT · 与s3相比,workdocs有什么优势 2 年前 |
![]() |
Eva · Github与AWS codecommit镜像和同步的操作 2 年前 |
![]() |
Hasham · 如何将多个本地文件上载到s3中的一个文件 2 年前 |
![]() |
sebas flores · S3 URL-使用python下载 2 年前 |