代码之家  ›  专栏  ›  技术社区  ›  Abir Chokraborty

寻找Spark SQL数组包含的替代解决方案

  •  0
  • Abir Chokraborty  · 技术社区  · 6 年前

    我使用嵌套数据结构(数组)来存储Spark表的多值属性。我在Spark SQL中使用array_contains(array,value)检查数组是否包含该值,但似乎存在性能问题。一个大的火花表要花很多时间。有没有别的解决办法。

    1 回复  |  直到 6 年前
        1
  •  1
  •   Arnon Rotem-Gal-Oz    6 年前

    你没有提供很多关于你到底在做什么的详细信息-如果你正在访问数组中的值很多如果可以用数组中的值添加列是有益的,例如通过使用 explode