代码之家 › 专栏 › 技术社区 › Science11

r重命名列名以包含0

rename multiple-columns dplyr string r

Science11 · 技术社区 · 3 年前

这是我的数据集

Id   Date        Col_a_1 Col_a_2 Col_a_3 Col_a_12 Col_a_65
1    02/19/2020  0        1       2       0        4
2    02/10/2020  1        2       0       1        3
1    03/11/2020  2        1       3       1        0
4    10/29/2020  1        0       2       1        0

最终的预期数据集是具有这些列名的数据集

Id   Date        col_b_01  col_b_02 col_b_03 col_b_12 col_a_65
1    02/19/2020  0         1        2        0        4
2    02/10/2020  1         2        0        1        3
1    03/11/2020  2         1        3        1        0
4    10/29/2020  1         0        2        1        0

虽然我可以单独重命名它们,但我喜欢更有效地重命名,但不确定如何重命名。非常感谢您的建议。提前谢谢。

2 回复 | 直到 3 年前

r2evans 3 年前

names(dat)[3:7]
# [1] "Col_a_1"  "Col_a_2"  "Col_a_3"  "Col_a_12" "Col_a_65"
gsub("_([0-9])$", "_0\\1", names(dat)[3:7])
# [1] "Col_a_01" "Col_a_02" "Col_a_03" "Col_a_12" "Col_a_65"
names(dat)[3:7] <- gsub("_([0-9])$", "_0\\1", names(dat)[3:7])
dat
#   Id       Date Col_a_01 Col_a_02 Col_a_03 Col_a_12 Col_a_65
# 1  1 02/19/2020        0        1        2        0        4
# 2  2 02/10/2020        1        2        0        1        3
# 3  1 03/11/2020        2        1        3        1        0
# 4  4 10/29/2020        1        0        2        1        0

Ronak Shah 3 年前

你可以用 str_replace 在里面 rename_with

library(dplyr)
library(stringr)

df %>%
  rename_with(~str_replace(., '\\d+', function(m) sprintf('%02s', m)), 
              starts_with('Col'))

#  Id       Date Col_a_01 Col_a_02 Col_a_03 Col_a_12 Col_a_65
#1  1 02/19/2020        0        1        2        0        4
#2  2 02/10/2020        1        2        0        1        3
#3  1 03/11/2020        2        1        3        1        0
#4  4 10/29/2020        1        0        2        1        0

数据

df <- structure(list(Id = c(1L, 2L, 1L, 4L), Date = c("02/19/2020", 
"02/10/2020", "03/11/2020", "10/29/2020"), Col_a_1 = c(0L, 1L, 
2L, 1L), Col_a_2 = c(1L, 2L, 1L, 0L), Col_a_3 = c(2L, 0L, 3L, 
2L), Col_a_12 = c(0L, 1L, 1L, 1L), Col_a_65 = c(4L, 3L, 0L, 0L
)), class = "data.frame", row.names = c(NA, -4L))

推荐文章

Marc B. · 使用ggplot2创建条形图时“缺少值”

1 年前

deschen · tidyverse与外部向量发生突变,该外部向量的元素是数据帧中的列值

1 年前

Laura · 在Shiny中使用可排序的包拖放名称,这些名称将成为图表

1 年前

Mallikarjun M · 如何使用随机森林进行时间序列预测?

1 年前

ly li · 模型摘要:当表格形状改变时,拟合优度消失

1 年前

C.Robin · 将marginaffects::predictions()的结果连接回main df?

1 年前

monotonic · 如何将格式为“col1+col3+col4”的数据帧的行名转换为一列数字向量“c(1,3,4)”?

2 年前

Shawn Hemelstrand · 为什么我的自定义errorbar函数不能在R中工作?

2 年前

RoyBatty · 统计每个字符在整个数据集中出现的次数

2 年前

stats_noob · R: 记录某个“行为”发生的循环的索引?

2 年前