代码之家 › 专栏 › 技术社区 › user113156

dplyr使用pipe函数将colnames替换为第一行并删除第一行

dplyr r

user113156 · 技术社区 · 6 年前

我试图将第一行设置为数据中的列名,但是我的数据包含许多因素,这会导致一些问题。

我正在尝试使用 dplyr

Str() 数据类型:

'data.frame':   2 obs. of  8 variables:
 $ 1   : Factor w/ 2045 levels " 200039"," 200171",..: 2045 1
 $ 2   : Factor w/ 3 levels " DR"," GR"," OU": 3 2
 $ 1372: Factor w/ 1388 levels "       12","       15",..: 1388 1372
 $ 4   : Factor w/ 51 levels " ATLANTA             ",..: 21 4
 $ NA  : logi  NA NA
 $ 63  : Factor w/ 498 levels " 435"," 436",..: 498 63
 $ 95  : Factor w/ 264 levels " 1114"," 1115",..: 264 95
 $ 118 : Factor w/ 132 levels " Chain1  "," Chain10 ",..: 131 118

我正在使用以下代码

x <- df %>%
  setNames(df[1, ])

它提供了以下输出:

     2045   3      1388                    21 NA  498   264       131
1 IRI_KEY  OU  EST_ACV   Market_Name          NA Open  Clsd  MskdName
2  200039  GR  9.709999  BUFFALO/ROCHESTER    NA  539  1219  Chain87

不管我想要什么 IRI_KEY , OU , EST_ACV 等作为列名。

我正在尝试使用因为我将删除第一行并删除 V5 NA 列。

我会提供数据,但数据使用的因素和规模太大,所以。我提供 head() 在前5个结果中。

       V1  V2        V3                    V4 V5   V6    V7        V8
1 IRI_KEY  OU  EST_ACV   Market_Name          NA Open  Clsd  MskdName
2  200039  GR  9.709999  BUFFALO/ROCHESTER    NA  539  1219  Chain87 
3  200171  GR  27.69099  MILWAUKEE            NA  522  9998  Chain97 
4  200197  GR     11.14  PEORIA/SPRINGFLD.    NA  903  9998  Chain59 
5  200233  GR  7.514999  OKLAHOMA CITY        NA 1122  1150  Chain102

dput() 在这里

https://textuploader.com/dn5vb

1 回复 | 直到 6 年前

markus 6 年前

你可以试试

library(purrr)
library(dplyr)
names <- sapply(df[1, setdiff(names(df), "V5")], as.character)
df %>% 
  select(-V5) %>% 
  set_names(., nm = names) %>%
  .[-1, ]
#  IRI_KEY OU  EST_ACV       Market_Name Open Clsd MskdName
#2  200039 GR 9.709999 BUFFALO/ROCHESTER  539 1219  Chain87
#3  200171 GR 27.69099         MILWAUKEE  522 9998  Chain97
#4  200197 GR    11.14 PEORIA/SPRINGFLD.  903 9998  Chain59
#5  200233 GR 7.514999    OKLAHOMA CITY  1122 1150 Chain102

提取除列以外的第一行 V5 并转换为字符。在“管道第一排除”列中 ,然后更改列名并删除第一行。

数据

df <- read.table(text = "       V1  V2        V3                    V4 V5   V6    V7        V8
IRI_KEY  OU  EST_ACV   Market_Name          NA Open  Clsd  MskdName
200039  GR  9.709999  BUFFALO/ROCHESTER    NA  539  1219  Chain87 
200171  GR  27.69099  MILWAUKEE            NA  522  9998  Chain97 
200197  GR     11.14  PEORIA/SPRINGFLD.    NA  903  9998  Chain59 
200233  GR  7.514999  'OKLAHOMA CITY'       NA 1122  1150  Chain102", header = TRUE)

推荐文章

Marc B. · 使用ggplot2创建条形图时“缺少值”

1 年前

deschen · tidyverse与外部向量发生突变,该外部向量的元素是数据帧中的列值

1 年前

Laura · 在Shiny中使用可排序的包拖放名称,这些名称将成为图表

1 年前

Mallikarjun M · 如何使用随机森林进行时间序列预测?

1 年前

ly li · 模型摘要:当表格形状改变时,拟合优度消失

1 年前

C.Robin · 将marginaffects::predictions()的结果连接回main df?

1 年前

monotonic · 如何将格式为“col1+col3+col4”的数据帧的行名转换为一列数字向量“c(1,3,4)”?

2 年前

Shawn Hemelstrand · 为什么我的自定义errorbar函数不能在R中工作?

2 年前

RoyBatty · 统计每个字符在整个数据集中出现的次数

2 年前

stats_noob · R: 记录某个“行为”发生的循环的索引?

2 年前