处理MASS：使用MM估计器多次拟合鲁棒回归时出现rlm错误

Question

我有一个具有以下结构的数据框：

W01           0.750000     0.916667     0.642857      1.000000      0.619565   
W02           0.880000     0.944444     0.500000      0.991228      0.675439   
W03           0.729167     0.900000     0.444444      1.000000      0.611111   
W04           0.809524     0.869565     0.500000      1.000000      0.709091   
W05           0.625000     0.925926     0.653846      1.000000      0.589286   

Variation  1_941119_A/G  1_942335_C/G  1_942451_T/C  1_942934_G/C  \
W01            0.967391      0.965909             1      0.130435   
W02            0.929825      0.937500             1      0.184211   
W03            0.925926      0.880000             1      0.138889   
W04            0.918182      0.907407             1      0.200000   
W05            0.901786      0.858491             1      0.178571   

Variation  1_944296_G/A    ...     X_155545046_C/T  X_155774775_G/T  \
W01            0.978261    ...            0.652174         0.641304   
W02            0.938596    ...            0.728070         0.736842   
W03            0.944444    ...            0.675926         0.685185   
W04            0.927273    ...            0.800000         0.690909   
W05            0.901786    ...            0.794643         0.705357   

Variation  Y_5100327_G/T  Y_5100614_T/G  Y_12786160_G/A  Y_12914512_C/A  \
W01             0.807692       0.800000        0.730769        0.807692   
W02             0.655172       0.653846        0.551724        0.666667   
W03             0.880000       0.909091        0.833333        0.916667   
W04             0.666667       0.642857        0.580645        0.678571   
W05             0.730769       0.720000        0.692308        0.720000   

Variation  Y_13470103_G/A  Y_19705901_A/G  Y_20587967_A/C  mean_age  
W01              0.807692        0.666667        0.333333      56.3  
W02              0.678571        0.520000        0.250000      66.3  
W03              0.916667        0.764706        0.291667      69.7  
W04              0.666667        0.560000        0.322581      71.6  
W05              0.703704        0.600000        0.346154      72.5  

[5 rows x 67000 columns]

我正在尝试使用MM-estimator拟合鲁棒的回归，并使用下面的代码段收集拟合的摘要统计信息（p值和斜率）：

> df %>%   gather(snp, value, -mean_age) %>% 
+     nest(-snp) %>% 
+     mutate(model = map(data, ~rlm(mean_age ~ value, data = ., method="MM", psi=psi.bisquare, maxit=50)), 
+            summary = map(model, glance)) %>% 
+     dplyr::select(-data, -model) %>% 
+     unnest(summary) -> linear_regression_results

但是，这会引发众所周知的rlm奇异错误：

Error in rlm.default(x, y, weights, method = method, wt.method = wt.method,  : 
  'x' is singular: singular fits are not implemented in 'rlm'

我想知道是否有关于如何解决此错误的建议？

Answer 1

有时是由于变量重复测量而导致此问题。 从上面的数据框1_942451_T/C可以明显看出，存在重复的值。 一个简单而临时的解决方案是抖动值：

jittered_DF <- data.frame(lapply(df, jitter))

要么

r_DF <- data.frame(lapply(df, rnorm))

如果jitter()方法仅适用于具有重复值的列，而不适用于整个数据帧，则可能会更加精确。

处理MASS：使用MM估计器多次拟合鲁棒回归时出现rlm错误

问题描述

1 个解决方案

解决方案1
0 已采纳 2019-07-10 19:20:35

处理MASS：使用MM估计器多次拟合鲁棒回归时出现rlm错误

问题描述

1 个解决方案

解决方案1 0 已采纳 2019-07-10 19:20:35

解决方案1
0 已采纳 2019-07-10 19:20:35