2
|
Christos Hadjinikolis · 技术社区 · 6 年前 |
1
0
在IntelliJ中运行Flink作业时,依赖Flink微型集群。迷你集群不同于在独立、纱线或Mesos上运行Flink,因为它依赖于单个JVM。此外,微型集群以多种方式进行了预配置,并且并不总是能够更改该配置(至少在某些设置方面)。 在将作业提交到集群时(而不是在通过小型集群运行作业时),我必须更改的一件事是分配给作业管理器的堆内存的大小。这是必要的,因为加载要处理的数据不是我想要运行的Flink作业的一部分(这在Flink中不是标准做法,实际上这样做是错误的)。通过增加作业管理器的堆,我能够让我的作业运行,但最终我必须为我的Flink作业定义一种新的输入格式,以避免作业管理器不得不预加载数据以供执行——无论如何,这不应该是它的责任。 对于眼前的问题:无法通过IntelliJ(据我所知)将堆内存分配给作业管理器,因此作业总是会失败。 |
Ellen Spertus · 使用Scala访问HBase的推荐方法 6 年前 |
Daniel · 目录中的Apache Flink流文件 6 年前 |
Jicaar · 一个卡夫卡制作人可以被多个接收器安全使用吗? 6 年前 |