1
13
ApacheNIFI不像ApacheAirflow或ApacheOozie那样是一个工作流管理器。它是一个数据流工具-它路由和转换数据。它不是为了安排作业,而是允许您从多个位置收集数据,定义处理该数据的离散步骤,并将该数据路由到不同的目的地。 ApacheFalcon的另一个不同之处在于,它允许您更轻松地定义和管理HDFS数据集。它有效地管理HDFS集群中的数据。 根据您的描述,NiFi将是对您的需求的有用补充。它将能够收集XML文件,以某种方式对其进行处理,将数据存储在MySQL中,并执行REST调用。它还可以方便地配置给新的供应商,并且可以很好地容忍故障。它并行执行大多数功能,并可扩展为具有多台主机的群集NiFi。它的设计考虑到了性能和可靠性。 我不确定的是执行图像处理的能力。有一些处理器(提取图像元数据、调整图像大小),但如果不是这样,您需要用Java开发一个新的处理器——这相对容易。或者,如果图像处理使用Python或其他脚本语言,则可以使用ExecuteScript处理器之一。
|
2
3
|
Ashu · 在csv文件中使用dataframe交换列-Python 2 年前 |
Srinivas · 如何通过气流将参数传递给hql管路 7 年前 |
Tia · 气流集成与BgQuery错误 7 年前 |
ozw1z5rd · 气流触发器如何更改执行日期 7 年前 |
Alexander Ershov · 通过UI将参数传递给气流的作业 7 年前 |