簡體   English   中英

當R無法識別連續變量時,如何在R中重新編碼缺失數據?

[英]How to recode missing data in R when R does not recognise the continuous variable?

我有一個連續的變量,有一些'NA',並且出於某種原因,當我試圖查看變量(即平均摘要)時,這就是出現的情況:

Summary(THM1$Br03)
Length  Class   Mode 
     0   NULL   NULL 

 mean(THM$Br03)
 [1] NA

這是查看前幾行時的輸出:

 WSZ_Code Treatment_Code Year Month  TTHM CL2_FREE    BrO3 Colour   PH  TURB
1          2              3 1996     1  30.7    0.350 0.00030   0.75 7.40 0.055
3          7              4 1996     2  60.4    0.050 0.00055   0.75 7.10 0.055
4          7              4 1996     2  58.1    0.150      NA   0.75 7.50 0.055

但是當我做str(THM)時:

'data.frame':   345 obs. of  10 variables:


$ WSZ_Code      : int  2 6 7 7 7 5 1 5 8 1 ...
$ Treatment_Code: int  3 1 4 4 4 2 2 2 1 2 ...
$ Year          : int  1996 1996 1996 1996 1996 1996 1996 1996 1996 1996 ...
$ Month         : int  1 2 2 2 3 3 3 3 3 3 ...
$ TTHM          : num  30.7 24.8 60.4 58.1 62.2 40.3 20.8 36.3 40.5 47.8 ...
$ CL2_FREE      : num  0.35 0.25 0.05 0.15 0.2 0.15 0.15 0.025 0.25 0.05 ...
$ BrO3          : num  0.0003 0.00055 0.00055 NA NA 0.0014 NA NA NA NA ...

好的,你可以看到前幾個值,然后它的NA,但我不能總結該變量中的任何數據! 我只需要對數據進行一些匯總統計,然后查看Br03和TTHM之間的關系

當我試着這個:

mean(THM$Br03, na.rm=TRUE)
[1] NA
Warning message:
In mean.default(THM$Br03, na.rm = TRUE) :
  argument is not numeric or logical: returning NA

這就是發生的事情。

我不知道如何將變量重新編碼為0或99,以便分析變量。

你拼寫的列名錯誤: THM1$Br03應該是THM1$BrO3 (注意O vs 0 )。 這就是THM$Br03為NULL的原因。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM