1
4
我假设在单节点场景中或多或少是一样的,但是如果你想利用Kafka的集群/负载平衡功能,你需要有多个分区。 Kafka中的水平扩展是通过将消费者群体分布在多台机器上并在其中分布分区来实现的。这仅在您有多个分区时有效。
|
Bruno Peixoto · Spark群集CI管道构建失败 1 年前 |
mcsilvio · 在foreach中组织联接的最佳方式是什么? 1 年前 |
Dhruv · 在sbt控制台上运行Spark 1 年前 |
Leonard · Pyspark:JSON到Pyspark数据帧 1 年前 |
billie class · 将列中的值重写为列表中的下一个值 2 年前 |