代码之家  ›  专栏  ›  技术社区  ›  Science11

r重命名列名以包含0

  •  0
  • Science11  · 技术社区  · 3 年前

    这是我的数据集

    Id   Date        Col_a_1 Col_a_2 Col_a_3 Col_a_12 Col_a_65
    1    02/19/2020  0        1       2       0        4
    2    02/10/2020  1        2       0       1        3
    1    03/11/2020  2        1       3       1        0
    4    10/29/2020  1        0       2       1        0
    

    最终的预期数据集是具有这些列名的数据集

    Id   Date        col_b_01  col_b_02 col_b_03 col_b_12 col_a_65
    1    02/19/2020  0         1        2        0        4
    2    02/10/2020  1         2        0        1        3
    1    03/11/2020  2         1        3        1        0
    4    10/29/2020  1         0        2        1        0
    

    虽然我可以单独重命名它们,但我喜欢更有效地重命名,但不确定如何重命名。非常感谢您的建议。提前谢谢。

    2 回复  |  直到 3 年前
        1
  •  2
  •   r2evans    3 年前
    names(dat)[3:7]
    # [1] "Col_a_1"  "Col_a_2"  "Col_a_3"  "Col_a_12" "Col_a_65"
    gsub("_([0-9])$", "_0\\1", names(dat)[3:7])
    # [1] "Col_a_01" "Col_a_02" "Col_a_03" "Col_a_12" "Col_a_65"
    names(dat)[3:7] <- gsub("_([0-9])$", "_0\\1", names(dat)[3:7])
    dat
    #   Id       Date Col_a_01 Col_a_02 Col_a_03 Col_a_12 Col_a_65
    # 1  1 02/19/2020        0        1        2        0        4
    # 2  2 02/10/2020        1        2        0        1        3
    # 3  1 03/11/2020        2        1        3        1        0
    # 4  4 10/29/2020        1        0        2        1        0
    
        2
  •  2
  •   Ronak Shah    3 年前

    你可以用 str_replace 在里面 rename_with

    library(dplyr)
    library(stringr)
    
    df %>%
      rename_with(~str_replace(., '\\d+', function(m) sprintf('%02s', m)), 
                  starts_with('Col'))
    
    #  Id       Date Col_a_01 Col_a_02 Col_a_03 Col_a_12 Col_a_65
    #1  1 02/19/2020        0        1        2        0        4
    #2  2 02/10/2020        1        2        0        1        3
    #3  1 03/11/2020        2        1        3        1        0
    #4  4 10/29/2020        1        0        2        1        0
    

    数据

    df <- structure(list(Id = c(1L, 2L, 1L, 4L), Date = c("02/19/2020", 
    "02/10/2020", "03/11/2020", "10/29/2020"), Col_a_1 = c(0L, 1L, 
    2L, 1L), Col_a_2 = c(1L, 2L, 1L, 0L), Col_a_3 = c(2L, 0L, 3L, 
    2L), Col_a_12 = c(0L, 1L, 1L, 1L), Col_a_65 = c(4L, 3L, 0L, 0L
    )), class = "data.frame", row.names = c(NA, -4L))