1
4
像Apache Flink这样的分布式系统设计用于在数百台机器上的数据中心中运行。它们不是为在一台计算机上并行计算而设计的。此外,弗林克针对的是大规模问题。在本地计算机上以秒为单位运行的作业不是Flink的主要用例。 并行化应用程序总是会导致开销。数据必须在进程和线程之间分布和共享。Flink通过序列化和反序列化跨TaskManager插槽分发数据。此外,启动和协调分布式任务也不是免费的。 在单机上使用分布式系统扩展小规模问题时,观察更长的执行时间并不奇怪。您可以将应用程序移植到利用共享内存的线程并行应用程序。 |
Ellen Spertus · 使用Scala访问HBase的推荐方法 6 年前 |
Daniel · 目录中的Apache Flink流文件 6 年前 |
Jicaar · 一个卡夫卡制作人可以被多个接收器安全使用吗? 6 年前 |