代码之家  ›  专栏  ›  技术社区  ›  Carlos Bribiescas

矢量化自定义项的性能增强分解是什么?

  •  0
  • Carlos Bribiescas  · 技术社区  · 5 年前

    我在看Spark 2.3中的矢量化UDF。在这个 this video

    • 慢速序列化
    • python中低效的数据结构

    this link ,此功能有很大的好处。有没有人知道这其中有多少是由于序列化改进,多少是由于pandas造成的?

    0 回复  |  直到 5 年前