簡體   English   中英

從數據框中提取特定列

[英]Extracting specific columns from a data frame

我有一個包含 6 列的 R 數據框,我想創建一個只有三列的新 dataframe。

假設我的數據框是df ,我想提取列ABE ,這是我能弄清楚的唯一命令:

 data.frame(df$A,df$B,df$E)

有沒有更緊湊的方法來做到這一點?

您可以使用列名向量進行子集化。 與那些將列名稱視為 object 名稱(例如subset() )的方法相比,我更喜歡這種方法,尤其是在函數、包或應用程序中編程時。

# data for reproducible example
# (and to avoid confusion from trying to subset `stats::df`)
df <- setNames(data.frame(as.list(1:5)), LETTERS[1:5])
# subset
df[c("A","B","E")]

請注意沒有逗號(即它不是df[,c("A","B","C")] )。 那是因為df[,"A"]返回一個向量,而不是數據框。 但是df["A"]總是會返回一個數據框。

str(df["A"])
## 'data.frame':    1 obs. of  1 variable:
## $ A: int 1
str(df[,"A"])  # vector
##  int 1

感謝David Dorchies指出df[,"A"]返回一個向量而不是 data.frame,感謝Antoine Fabri為我的原始解決方案(下圖)提出了更好的替代方案(上圖)。

# subset (original solution--not recommended)
df[,c("A","B","E")]  # returns a data.frame
df[,"A"]             # returns a vector

使用dplyr package,如果你的 data.frame 被稱為df1

library(dplyr)

df1 %>%
  select(A, B, E)

這也可以在沒有%>% pipe 的情況下寫成:

select(df1, A, B, E)

這是subset() function的作用:

> dat <- data.frame(A=c(1,2),B=c(3,4),C=c(5,6),D=c(7,7),E=c(8,8),F=c(9,9)) 
> subset(dat, select=c("A", "B"))
  A B
1 1 3
2 2 4

有兩個明顯的選擇:Joshua Ulrich 的df[,c("A","B","E")]

df[,c(1,2,5)]

如在

> df <- data.frame(A=c(1,2),B=c(3,4),C=c(5,6),D=c(7,7),E=c(8,8),F=c(9,9)) 
> df
  A B C D E F
1 1 3 5 7 8 9
2 2 4 6 7 8 9
> df[,c(1,2,5)]
  A B E
1 1 3 8
2 2 4 8
> df[,c("A","B","E")]
  A B E
1 1 3 8
2 2 4 8

其中 df1 是您的原始數據框:

df2 <- subset(df1, select = c(1, 2, 5))

僅出於某種原因

df[, (names(df) %in% c("A","B","E"))]

為我工作。 所有上述語法都產生了“未定義的列選擇”。

您還可以使用sqldf package 對 R 數據幀執行選擇,如下所示:

df1 <- sqldf("select A, B, E from df")

這給出了 output 的數據框df1 ,列為:A、B、E。

您可以with

with(df, data.frame(A, B, E))
df<- dplyr::select ( df,A,B,C)

此外,您可以為新創建的數據分配不同的名稱

data<- dplyr::select ( df,A,B,C)

[和 subset 不可替代:

[如果只選擇一列,則返回一個向量。

df = data.frame(a="a",b="b")    

identical(
  df[,c("a")], 
  subset(df,select="a")
) 

identical(
  df[,c("a","b")],  
  subset(df,select=c("a","b"))
)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM