代码之家  ›  专栏  ›  技术社区  ›  psihodelia

高度并发的多线程应用程序需要硬件

  •  1
  • psihodelia  · 技术社区  · 15 年前

    我正在寻找一个硬件,它必须运行大约256计算密集型 实时 24小时模式下的并发任务(一个多线程C应用程序)。每项任务需要大约40-50兆次循环,因此所有任务都需要大约10兆次循环。CPU-RAM速度微不足道。所有任务都必须由Linux内核(32位,带SMP)管理。

    我正在寻找一个单主板解决方案与一个多核心CPU(如果这样的CPU存在)。如果这样的CPU不存在,那么我需要一个多插槽主板解决方案(带有多个CPU)。

    你能给我推荐任何专业的CPU/主板解决方案来满足这些要求吗?Linux内核(2.6.25)没有问题也是非常重要的。无需虚拟化,无需庞大的RAM或CPU缓存。我也更喜欢英特尔体系结构和久经考验的稳定性。我仍然怀疑它是否可行。

    先谢谢你。

    我想我找到了一个正确的答案 here here .

    7 回复  |  直到 7 年前
        1
  •  3
  •   Bill the Lizard Alexis MP    12 年前

    UltraSPARC T2 有8个内核,每个内核有8个线程。集成高带宽内存和IO。这个 T5140 为128个硬件线程提供其中两个线程。

    8个浮点单元的理论最大原始性能为每秒11千兆次(GFlops/s)。然而,与其他实现相比,一个巨大的优势是64个线程可以共享单元,因此我们可以实现非常高的理论峰值百分比。我们的实验已达到11 Gflop/s的近90%。-( http://blogs.oracle.com/deniss/entry/floating_point_performance_on_the )

        2
  •  1
  •   jldupont    15 年前
    1. 租用一些AmazonEC2节点。

    2. 更新

    3. 围绕 FPGAs :现在,一些变体包括可以运行Linux的处理器。

        3
  •  1
  •   Adam Davis    15 年前

    即使您已经为我们提供了您认为需要的规范,但如果您告诉我们应用程序打算实现什么,以及它是如何实现的,我们可能会更好地帮助您。

        4
  •  0
  •   Aaron    15 年前

    不是英特尔体系结构,而是运行linux,在单个芯片上有64个内核。

    TILEPro64

        5
  •  0
  •   Timo Geusch    15 年前

    获取一组四核或八核机器,并使用某种网格或集群软件在机器之间分割处理。也许你可以看看 Beowulf .

    正如你所提到的,10Gblops并不值得一提,所以在一台机器上,它会很昂贵。还有一个问题是,当机器坏了,你怎么办?你不太可能有第二台类似规格的机器。如果您使用商品硬件构建集群,那么您的弹性会更强,并且更容易找到替换机器。

        6
  •  0
  •   Eric Seppanen    15 年前

    MFLOP和GFLOP是程序在任何给定CPU上运行情况的非常差的指标。如今,缓存占用空间更为重要;也许分支预测的准确性也是如此。

    在不同的体系结构上,几乎没有任何方法可以衡量给定应用程序的性能,而不实际地对其进行分析。即使如此,如果你运气不好,在不知不觉中使用破坏了缓存占用空间的编译器选项进行构建,或者使用了一个糟糕的线程库,或者使用了上百种其他东西中的任何一种,你可能也不会有好主意。

        7
  •  0
  •   jsbueno    15 年前

    我知道你更喜欢英特尔,但如果你需要一个芯片,我会再次建议使用cell处理器- 它的理论峰值性能大约为25GFlops——内核2.6.25已经支持它了。

    您可以尝试使用pre-slim playstation 3进行试验(成本很低),或者以大约8000美元的价格购买一个基于服务器的解决方案-您必须重新编写和微调线程,以获得SPU协处理器的优势,但是,您可以通过一个单元(1个PPC核心+8个SPU)不费吹灰之力地满足您的计算需求

    Mercury计算机系统: http://www.mc.com/microsites/cell/products.aspx?id=6986

    Mercury没有在网站上列出任何价格,但这些PCI Express卡的价格似乎在之前提到的8000.00美元左右。

    playstation 3视频游戏的售价约为300美元,可以让您制作应用程序原型,并检查它是否达到所需的性能(我自己买了一个,让Fedora 9在上面运行,尽管我是作为一个哈比人这样做的,到目前为止,还没有用它进行任何计算——我还为当地大学的分子模拟组装了一个Playstation-3 12 Machine集群。他们运行的应用程序没有利用多媒体SPU的优势,而我当时正在与之联系。但即便如此,在3.5GHz的频率下,他们的表现也比标准的、价格不高的、PC的好,即使考虑到PS3的价格比这里高出5倍)