代码之家 › 专栏 › 技术社区 › Sai

Spark scala中基于json对象参数的调用方法?

scala-collections user-defined-functions apache-spark scala

Sai · 技术社区 · 7 年前

我有如下JSON对象。。

{"name":"method1","parameter1":"P1","parameter2":"P2","parameter3":"P3","parameter4":"P4"}

{"name":"method2","parameter1":"P1","parameter2":"P2","parameter3":"P3","parameter4":"P4","parameter5":"P5","parameter6":"P6"}

我有不同的功能和不同的逻辑,如贝娄

def method1(P1:String, P2:Int, P3:String, P4:String)={
  println(p1)
  println(p2)
  println(p3)
  println(p4)
} 

def method2(P1:String, P2:Int, P3:String, P4:String,P5:String,P6:String)={
  println(p1)
  println(p2)
  println(p3)
  println(p4)
  println(p6)
  println(p5)
}

使用这个对象,我必须调用我的方法。

method1(P1: String, P2: Int, P3: String, P4: String) )以铰孔特性为参数。

基于我的JSON第一个参数,我用剩余的参数调用了这个函数。请告诉我如何实现这一点?

1 回复 | 直到 7 年前

Ramesh Maharjan 7 年前

以下是使用 dataframe .

你有一个有效的 json 可通读的格式火花变成一个 数据帧

val df = sqlContext.read.json("path to the json file")

应该给你的 数据帧 像

+-------+----------+----------+----------+----------+----------+----------+
|name   |parameter1|parameter2|parameter3|parameter4|parameter5|parameter6|
+-------+----------+----------+----------+----------+----------+----------+
|method1|P1        |P2        |P3        |P4        |null      |null      |
|method2|P1        |P2        |P3        |P4        |P5        |P6        |
+-------+----------+----------+----------+----------+----------+----------+

现在,我通过更改 基本数据类型 到 column 和印刷已更改为串联传递的字符串数。

import org.apache.spark.sql.Column
import org.apache.spark.sql.functions._
def method1(P1:Column, P2:Column, P3:Column, P4:Column)={
  concat_ws(",", P1, P2, P3, P4)
}

def method2(P1:Column, P2:Column, P3:Column, P4:Column,P5:Column,P6:Column)={
  concat_ws(",", P1, P2, P3, P4, P5, P6)
}

根据上填充的值,可以调用这两个方法 name 列使用 when

df.withColumn("methodCalling", when($"name" === "method1", method1($"parameter1",$"parameter2",$"parameter3",$"parameter4"))
  .otherwise(when($"name" === "method2", method2($"parameter1",$"parameter2",$"parameter3",$"parameter4",$"parameter5",$"parameter6"))))
  .show(false)

这应该给你

+-------+----------+----------+----------+----------+----------+----------+-----------------+
|name   |parameter1|parameter2|parameter3|parameter4|parameter5|parameter6|methodCalling    |
+-------+----------+----------+----------+----------+----------+----------+-----------------+
|method1|P1        |P2        |P3        |P4        |null      |null      |P1,P2,P3,P4      |
|method2|P1        |P2        |P3        |P4        |P5        |P6        |P1,P2,P3,P4,P5,P6|
+-------+----------+----------+----------+----------+----------+----------+-----------------+

我希望答案是有帮助的,并且应该给你更多关于应该如何进行的总体想法。

推荐文章

Klang · 我怎么做我自己的绳子。Split()和数组。Reverse()一个用户定义函数中的内置函数,用于反转给定字符串?

2 年前

Terry · 在udf和日志行中使用Try-match进行错误处理时失败

6 年前

Aleksejs R · 如何将参数传递给配置单元视图,以便视图根据传递的内容进行更改?

6 年前

wttttt · Spark scala数据框udf返回行

6 年前

LalaJava · Java方法字符模式-初学者

6 年前

user8704018 · 定义函数的一种奇怪类型

6 年前

newbieHalp · 多维数组中对列进行分组和求和的C函数

7 年前

Joshua Howard · 火花聚合器无法正常工作

7 年前

Aber Abou-Rahma · Apache PHOENIX-UDF返回VARCHAR array-Create命令

7 年前

user3407267 · Scala:使用try/catch重试以处理异常

7 年前