簡體   English   中英

如何在 function 中使用 R 字符向量元素作為字符串和變量?

[英]How to use R character vector element as string and variable inside function?

我正在嘗試將 SPSS 樣式類別標簽應用於 R 中的數據集。 我認為我的問題出現了,因為我不知道如何正確解析變量,所以不一定只與這些類型的數據有關。 首先,按照expss庫文檔手動執行此操作可以正常工作:

library(expss)

#Load in the data
data(mtcars)

#Apply Variable Labels and Value Labels (and Numeric Coding) to each Variable.
mtcars = apply_labels(mtcars,
                      vs = "Engine",
                      vs = c("V-engine" = 1,
                             "Straight engine" = 2,
                             "Other engine" = 3)
)

現在,如果我將“變量名稱”、“變量標簽”、“值標簽”和相應的“值數字代碼”存儲在某些 R 數據類型中並且我嘗試在apply_labels function 中使用它們,就會出現我的問題。 例如,如果我將這些存儲在字符向量中,如下所示:

#Load in the data
data(mtcars)

#Value Labels
value_lab<-c("V-engine","Straight engine","Other engine")
#Value's Numeric coding
value_num<-c("1","2","3")

#Variable names
var <- c("vs")
#Variable Labels
var_lab<-c("Engine")

那么我的問題是,我將如何在apply_labels function 中使用我的字符向量元素? 例如,我將如何做這樣的事情:

#Apply Variable Labels and Value Labels (and Numeric Coding) to each Variable.
mtcars = apply_labels(mtcars,
                      var[1] = var_lab[1],
                      var[1] = c(value_lab[1] = value_num[1],
                                 value_lab[2] = value_num[2],
                                 value_lab[3] = value_num[3])
)

我嘗試了pastetoString的各種組合但沒有成功。 我的下一步是將其應用於我的 500,000+ 行 x 20,000 列數據,其中可能的值標簽/數字編碼數量待定。 強制性:我是 R 的新手。 謝謝你。

為了達到你想要的結果

  1. 利用命名列表和向量來存儲變量和值標簽
  2. 這樣做您可以使用do.call將變量和值標簽傳遞給apply_labels

為了使示例更有趣,我為第二個變量添加了標簽。

library(expss)

# Variable Labels
var_labels <- list(vs = "Engine", am = "Transmission")
#Value Labels
val_labels <- list(
  vs = c("V-engine" = 0, "Straight engine" = 1),
  am = c("Automatic" = 0, "Manual" = 1)
)

mtcars2 <- do.call(apply_labels, c(list(data = mtcars), var_labels, val_labels))

table(mtcars2$am, mtcars2$vs)
#>            
#>             V-engine Straight engine
#>   Automatic       12               7
#>   Manual           6               7

太好了謝謝! 這使我理解了命名列表並使用setNames構建了一個解決方案。

我最終沒有使用expss 它似乎在 R 中工作並按預期標記了所有內容,但是當我從 R 將最終 dataframe 導出到 SPSS 時,未使用haven::write_sav維護標簽值。

相反,我使用了標記為向量 classhaven來應用變量和值標簽。 我的最終解決方案如下所示:

#Load in the data
data(mtcars)

#Variables
var <- c("vs")
#Variable Labels
var_labels<-c("Engine")

#Value Labels (for first Variable)
value_labs<-c("V-engine","Straight engine","Other engine")
#Value's Numeric coding )
value_num<-c("1","2","3")

#Make a named list to use as the value labels
value_labels <- setNames(as.integer(value_num),value_labs)

#Apply the label with haven
mtcars[,c(var[1])]<-labelled(mtcars[, c(var[1])],
                              labels=value_labels,
                              label=var_labels[1])

#Save out in spss format
haven::write_sav(mtcars, "test.sav")

另外,我已經進行了設置,因此我的數據一次包含一組值標簽,但是您擴展到第二個變量的示例也幫助我概括了這一點,再次感謝!

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM