代码之家  ›  专栏  ›  技术社区  ›  Vikrant Sonawane

Scala/Spark XML摄取:列值作为XML数据的一部分

  •  2
  • Vikrant Sonawane  · 技术社区  · 6 年前

    我有一个XML来自一个在XML标记中包含列信息的源

    <root>
    <item>001</item>
    <attribute_type>Name</attribute>
    <attribute_value>ABC</attribute_value>
    <attribute_type>address</attribute>
    <attribute_value>XYZ</attribute_value>
    </root>
    

    输出应如下:

    Item | Name  | Address
    001  | ABC   | XYZ
    

    最后我想把这些数据推到一个HDFS。

    0 回复  |  直到 6 年前