[英]How to recode missing data in R when R does not recognise the continuous variable?
我有一個連續的變量,有一些'NA',並且出於某種原因,當我試圖查看變量(即平均摘要)時,這就是出現的情況:
Summary(THM1$Br03)
Length Class Mode
0 NULL NULL
mean(THM$Br03)
[1] NA
這是查看前幾行時的輸出:
WSZ_Code Treatment_Code Year Month TTHM CL2_FREE BrO3 Colour PH TURB
1 2 3 1996 1 30.7 0.350 0.00030 0.75 7.40 0.055
3 7 4 1996 2 60.4 0.050 0.00055 0.75 7.10 0.055
4 7 4 1996 2 58.1 0.150 NA 0.75 7.50 0.055
但是當我做str(THM)時:
'data.frame': 345 obs. of 10 variables:
$ WSZ_Code : int 2 6 7 7 7 5 1 5 8 1 ...
$ Treatment_Code: int 3 1 4 4 4 2 2 2 1 2 ...
$ Year : int 1996 1996 1996 1996 1996 1996 1996 1996 1996 1996 ...
$ Month : int 1 2 2 2 3 3 3 3 3 3 ...
$ TTHM : num 30.7 24.8 60.4 58.1 62.2 40.3 20.8 36.3 40.5 47.8 ...
$ CL2_FREE : num 0.35 0.25 0.05 0.15 0.2 0.15 0.15 0.025 0.25 0.05 ...
$ BrO3 : num 0.0003 0.00055 0.00055 NA NA 0.0014 NA NA NA NA ...
好的,你可以看到前幾個值,然后它的NA,但我不能總結該變量中的任何數據! 我只需要對數據進行一些匯總統計,然后查看Br03和TTHM之間的關系
當我試着這個:
mean(THM$Br03, na.rm=TRUE)
[1] NA
Warning message:
In mean.default(THM$Br03, na.rm = TRUE) :
argument is not numeric or logical: returning NA
這就是發生的事情。
我不知道如何將變量重新編碼為0或99,以便分析變量。
你拼寫的列名錯誤: THM1$Br03
應該是THM1$BrO3
(注意O
vs 0
)。 這就是THM$Br03
為NULL的原因。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.