代码之家  ›  专栏  ›  技术社区  ›  Alex Jolly

如何在另一个pyspark数据帧中查询开始时间和结束时间之间的日期时间

  •  0
  • Alex Jolly  · 技术社区  · 2 年前

    我有两张桌子 一个有开始时间和结束时间的文件

    +---------+-----------------------+-----------------------+
    |channelId|starttime               |endtime                |
    +---------+-----------------------+-----------------------+
    |1        |2022-03-31 18:57:46.329|2022-03-31 18:58:46.329|
    |2        |2022-03-31 18:58:48.61 |2022-03-31 18:59:48.61 |
    +---------+-----------------------+-----------------------+
    

    第二个表包含时间序列数据

    |channelId|time                   |
    +---------+-----------------------+
    |1        |2022-03-31 18:58:46.329|
    |1        |2022-03-31 18:58:46.329|
    |1        |2022-03-31 18:58:46.329|
    |2        |2022-03-31 18:59:48.61 |
    +---------+-----------------------+
    

    我想从第二个表中查询两个channelId的第一个表时间范围之间的数据

    预期2个数据帧

    |channelId|time                   |
    +---------+-----------------------+
    |1        |2022-03-31 18:58:46.329|
    |1        |2022-03-31 18:58:46.329|
    |1        |2022-03-31 18:58:46.329|
    

    |2        |2022-03-31 18:59:48.61 |
    +---------+-----------------------+
    
    0 回复  |  直到 2 年前