簡體   English   中英

稀疏偏最小二乘回歸

[英]sparse partial least square regression

我有兩個數據集,如下所示:

     http://www.filedropper.com/dataa_1 ## DataA
     http://www.filedropper.com/datab   ## DataB

在dataA中,我們有42行8列,在DataB中,我們有42行6列。 我們想使用R中的這兩個數據進行CCA和sPLS。但是我的問題是,當我們查看DataB時,總是每11行將具有相同的值。 這會影響結果還是會導致CCA或sPLS出現差異?

看完塊B之后,看起來變量是離散的。

在PLS或CCA中使用此類變量不是(技術上的)問題,但會帶來統計上的“挑戰”:可能需要使用自舉或折刀來進一步對結果進行統計解釋。

您還應該問自己,這種“離散”表示對於您的數據是否准確。 如果原始變量是分類變量,則可能是錯誤的,在這種情況下,您應該使用啞變量

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM