簡體   English   中英

如何規范化 R 中的數據

[英]How to normalize data in R

這是我的數據:

a       b       c     d         e           f           g
<dbl>   <dbl>   <dbl> <dbl>     <dbl>       <dbl>       <dbl>
14.6    74529   720   4639.341  10039.323   0.3089194   0.00011135818
270.0   74529   720   4639.341  10039.323   0.3089194   0.00011135818
14.6    74529   720   4639.341  10039.323   0.3089194   0.00011135818
390.0   74529   720   4639.341  10039.323   0.3089194   0.00011135818
2000.0  74529   720   4639.341  10039.323   0.3089194   0.00011135818
2452.0  74529   720   4639.341  10039.323   0.3089194   0.00011135818
10315.0 74529   720   4639.341  10039.323   0.3089194   0.00011135818
190.6   74529   720   4639.341  10039.323   0.3089194   0.00011135818
1050.0  74529   720   4639.341  10039.323   0.3089194   0.00011135818
14.6    74529   720   4639.341  10039.323   0.3089194   0.00011135818
...

假設我想通過對其他變量執行加法來創建一個新變量。 但是,由於變量沒有可比的比例,我需要重新調整它們。 變量的分布不是正態的,標准化過程也應該對異常值具有魯棒性。 那么標准化數據的最佳方法是什么,以便我可以對變量求和以為我的數據創建一個新參數?

使用scale(x) 要處理異常值,請丟棄高於某個閾值的縮放值,例如which(abs(scale(x))>3)將指出數據遠離平均值而不是 3 sd

對每一列執行此操作,並在繼續之前形成要從所有列中丟棄的所有異常值的並集。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM