簡體   English   中英

如何使用 tidymodels 在我的結果變量中設置哪個級別是“事件”?

[英]How do I set which level is the “event” in my outcome variable using tidymodels?

我正在使用進行機器學習,並且我想預測二進制響應/結果。 如何指定結果的哪個級別是“事件”或正面案例?

這發生在食譜中還是其他地方?


##split the data
anxiety_split <- initial_split(anxiety_df, strata = anxiety)


anxiety_train <- training(anxiety_split)
anxiety_test <- testing(anxiety_split)


set.seed(1222) 
anxiety_cv <- vfold_cv(anxiety_train, strata = anxiety)

anxiety_rec <- recipe(anxiety ~ ., data = anxiety_train, positive = 'pos') %>%
  step_corr(all_numeric()) %>%
  step_dummy(all_nominal(), -all_outcomes()) %>%
  step_zv(all_numeric()) %>%
  step_normalize(all_numeric())

在評估 model 之前,您無需設置結果變量的哪個級別是“事件”。 您可以使用大多數標准函數的event_level參數來執行此操作。 例如,查看如何為yardstick::roc_curve()執行此操作:

library(yardstick)
#> For binary classification, the first factor level is assumed to be the event.
#> Use the argument `event_level = "second"` to alter this as needed.
library(tidyverse)

data(two_class_example)


## looks good!
two_class_example %>%
  roc_curve(truth, Class1, event_level = "first") %>%
  autoplot()



## YIKES!! we got this backwards
two_class_example %>%
  roc_curve(truth, Class1, event_level = "second") %>%
  autoplot()

代表 package (v0.3.0.9001) 於 2020 年 8 月 2 日創建

注意標准啟動時的消息; 假設第一個因素水平是事件。 這類似於基礎 R 的行為方式。 如果您的“事件”不是第一個因素級別,您只需要擔心event_level

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM