![](/img/trans.png)
[英]How to make R insert a '0' in place of missing values while reading a CSV?
[英]How to insert a place holder in a list, where pieces of data are missing using R?
我必須分析一組來自實驗的數據。 但是由於其中還有很多數據對我來說並不重要,因此我想使用R整理一下這些文件,因為這需要手動進行太多工作。 由於這些.csv文件中的數據是不定期的實驗,因此不同測量的順序很重要,並且不同編號必須按特定順序排列。
到目前為止,我已經設法選擇所需的所有列,並使用以下代碼按不同的條件對其進行排序:
used_columns <- select(df,
ImageNumber,
FrameNumber,
Treatment,
Intensity1,
Intensity2)
used_columns.t <- as.tibble(used_columns)
df_sorted <- used_columns.t %>%
filter(Treatment == "B2") %>%
.[order(as.integer(.$FrameNumber),decreasing = FALSE), ]
使用此代碼,df_sorted產生一個數據幀,如下所示:
ImageNumber FrameNumber Treatment Intensity1 Intensity2
1 1 B2 1598,45 0,14
2 1 B2 930,40 0,11
3 1 B2 107,86 0,04
4 1 B2 881,09 0,11
7 1 B2 2201,98 0,15
8 1 B2 161,30 0,04
9 1 B2 1208,14 0,17
4 2 B2 831,75 0,12
5 2 B2 1027,41 0,14
7 2 B2 2052,16 0,15
8 2 B2 159,63 0,05
9 2 B2 1111,49 0,16
10 2 B2 1312,15 0,12
1 3 B2 863,79 0,10
2 3 B2 104,06 0,04
3 3 B2 816,02 0,11
4 3 B2 1053,02 0,14
5 3 B2 132,32 0,03
6 3 B2 2059,03 0,14
7 3 B2 153,49 0,04
8 3 B2 1118,69 0,15
9 3 B2 1632,66 0,18
10 3 B2 1302,15 0,12
但是,我希望有一個這樣的表,其中缺失的值表示為NA(或任何其他占位符):
ImageNumber FrameNumber Treatment Intensity1 Intensity2
1 1 B2 1598,45 0,14
2 1 B2 930,40 0,11
3 1 B2 107,86 0,04
4 1 B2 881,09 0,11
5 NA NA NA NA
6 NA NA NA NA
7 1 B2 2201,98 0,15
8 1 B2 161,30 0,04
9 1 B2 1208,14 0,17
10 NA NA NA NA
1 NA NA NA NA
2 NA NA NA NA
3 NA NA NA NA
4 2 B2 831,75 0,12
5 2 B2 1027,41 0,14
6 NA NA NA NA
7 2 B2 2052,16 0,15
8 2 B2 159,63 0,05
9 2 B2 1111,49 0,16
10 2 B2 1312,15 0,12
1 3 B2 863,79 0,10
2 3 B2 104,06 0,04
3 3 B2 816,02 0,11
4 3 B2 1053,02 0,14
5 3 B2 132,32 0,03
6 3 B2 2059,03 0,14
7 3 B2 153,49 0,04
8 3 B2 1118,69 0,15
9 3 B2 1632,66 0,18
10 3 B2 1302,15 0,12
這只是我所擁有的表的一小部分,實際上,根據條件的不同,ImageNumber可能會達到1441。您知道任何可能性,我如何解決這個問題?
如果有人可以幫助我,我將不勝感激!
這是base R
的拆分應用合並方法
out <- do.call(rbind,
by(
data = df1,
INDICES = df1$FrameNumber,
FUN = merge,
y = data.frame(ImageNumber = seq(min(df1$ImageNumber), max(df1$ImageNumber))),
all.y = TRUE
))
out
# ImageNumber FrameNumber Treatment Intensity1 Intensity2
#1.1 1 1 B2 1598,45 0,14
#1.2 2 1 B2 930,40 0,11
#1.3 3 1 B2 107,86 0,04
#1.4 4 1 B2 881,09 0,11
#1.5 5 NA <NA> <NA> <NA>
#1.6 6 NA <NA> <NA> <NA>
#1.7 7 1 B2 2201,98 0,15
#1.8 8 1 B2 161,30 0,04
#1.9 9 1 B2 1208,14 0,17
#1.10 10 NA <NA> <NA> <NA>
#2.1 1 NA <NA> <NA> <NA>
#2.2 2 NA <NA> <NA> <NA>
#2.3 3 NA <NA> <NA> <NA>
#2.4 4 2 B2 831,75 0,12
# ...
我們按FrameNumber
拆分數據,將每個列表元素與一個數據幀合並,該數據幀包含一個稱為ImageNumber
列。 該列包含從min(df1$ImageNumber)
到max(df1$ImageNumber)
-在您的示例中為1
到10
。 屬於merge
的參數all.y = TRUE
將隱式缺失值轉換為顯式缺失值。
最后,我們將列表與do.call(rbind, ...)
組合回到一個數據幀。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.