[英]Subset of rows containing NA (missing) values in a chosen column of a data frame
[英]How to assign values to a column for a subset of data frame rows
我有一個很大的數據框,我正在嘗試為特定子集的特定數據列分配值。
subset(P2Y12R_binding_summary,(SYSTEM=="4NTJ")&(VARIANT=="D294N"))
SYSTEM VARIANT MODEL EPSIN INP dE_water_free dE_ERR_water_free dE_water_periodic dE_ERR_water_periodic
1 4NTJ D294N LVLSET 1 1 -42.155 29.28460 -42.205 29.52604
2 4NTJ D294N LVLSET 1 2 -34.225 29.75176 -34.235 29.96571
3 4NTJ D294N LVLSET 20 1 -65.163 40.62241 -65.163 40.52564
4 4NTJ D294N LVLSET 20 2 -57.454 41.04459 -57.454 41.26962
5 4NTJ D294N SES 1 1 -23.406 30.56636 -23.335 30.75794
6 4NTJ D294N SES 1 2 -15.434 30.70035 -15.414 30.85944
7 4NTJ D294N SES 20 1 -64.351 40.65919 -64.350 40.51345
8 4NTJ D294N SES 20 2 -56.342 41.23456 -56.542 41.21865
現在,假設我使用添加新的列到框架(Ki_expt)
P2Y12R_binding_summary$Ki_expt <- 0
我只想為與上述子集相對應的行更新此列的值。
嘗試幼稚的方法失敗:
>subset(P2Y12R_binding_summary,(SYSTEM=="4NTJ")&(VARIANT=="D294N"))$Ki_expt = 42.2
要么
>subset(P2Y12R_binding_summary,(SYSTEM=="4NTJ")&(VARIANT=="D294N"))$Ki_expt <- 42.2
兩者都產生錯誤消息:
Error in subset(P2Y12R_binding_summary, (SYSTEM == "4NTJ") & (VARIANT == :
could not find function "subset<-"
有人知道這樣做的適當方法嗎? 顯然,使用for循環是可能的,但是這似乎很笨拙,而且可能會很慢(如以前的經驗所示)。
如果速度是一個問題,我會看一下data.table
(無論如何我通常都會看那里)。
library(data.table)
setDT(P2Y12R_binding_summary)[SYSTEM=="4NTJ" & VARIANT=="D294N", Ki_expt := 42.2 ]
an Example using diamonds:
library(data.table)
dummydf <- diamonds
setDT(dummydf)[cut =="Premium" & color =="J", example := 42.2 ]
dummydf[!is.na(example)]
carat cut color clarity depth table price x y z example
1: 0.30 Premium J SI2 59.3 61 405 4.43 4.38 2.61 42.2
2: 1.00 Premium J SI2 62.3 58 2801 6.45 6.34 3.98 42.2
3: 0.93 Premium J SI2 61.9 57 2807 6.21 6.19 3.84 42.2
4: 1.17 Premium J I1 60.2 61 2825 6.90 6.83 4.13 42.2
5: 0.33 Premium J VS1 62.8 58 557 4.41 4.38 2.76 42.2
---
804: 1.01 Premium J I1 60.7 59 2602 6.42 6.39 3.89 42.2
805: 1.01 Premium J SI2 58.3 62 2683 6.49 6.43 3.77 42.2
806: 1.01 Premium J SI2 59.3 56 2683 6.51 6.45 3.84 42.2
807: 0.90 Premium J SI2 62.7 57 2717 6.09 6.06 3.80 42.2
808: 0.90 Premium J SI2 63.0 59 2717 6.14 6.11 3.86 42.2
請注意,您只能一次設置DT()。 之后,只需使用dummydf [子集,LHS名稱:= RHS值]來調用您的DT
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.