代码之家  ›  专栏  ›  技术社区  ›  William

从字符串中提取日期并保存在新的数据帧列中

  •  0
  • William  · 技术社区  · 4 年前

    背景:

    tweet weather 列。DataFrame列是当前列,如下所示-

    enter image description here

    目标:
    我正试图从地图上提取日期戳 天气 datestamp date 列,用于对其进行筛选,例如筛选到最新日期。

    我知道如何将列字符串值更改为 日期戳 ,如果是类似“20140512”的东西。但是我不知道如何识别 日期戳 并将其提取到一个新列中。

    如有任何建议,将不胜感激

    0 回复  |  直到 4 年前
        1
  •  0
  •   Derek Eden    4 年前

    您可以这样做,假设它位于“天气”列中,并且始终具有相同的格式:

    df['date'] = pd.to_datetime(df['weather'].str.extract('\((\d{4}-\d{2}-\d{2})\)')[0])
    

    import re
    df['date'] = pd.to_datetime(df['weather'].apply(lambda x: re.search('\((\d{4}-\d{2}-\d{2})\)', x).group(1)))