[英]Cannot tune the mtry parameter in my random forest (with ranger) using Tidy models R
我正在嘗試使用 tune() 和 R 中的 Tidy model 環境調整隨機森林 model 的參數。我使用 ranger 作為引擎,這是一個分類 model,但我無法調整 mtry 參數。 我試過: 它適用於樹和 min_n 參數,但如果我嘗試使用 mtry = tune(),然后創建網格,則 ...
[英]Cannot tune the mtry parameter in my random forest (with ranger) using Tidy models R
我正在嘗試使用 tune() 和 R 中的 Tidy model 環境調整隨機森林 model 的參數。我使用 ranger 作為引擎,這是一個分類 model,但我無法調整 mtry 參數。 我試過: 它適用於樹和 min_n 參數,但如果我嘗試使用 mtry = tune(),然后創建網格,則 ...
[英]How do I calculate quadratic weighted Kappa in a Tidymodels pipeline?
我有以下代碼作為一個簡單的例子。 kap function 計算默認情況下沒有權重的 Kappa 指標。 要計算二次加權 Kappa,您必須添加weighting = "quadratic"作為參數,而metric_set()似乎不接受。 如何將 QWK 包含在指標 output 中? 抱歉,如 ...
[英]Use custom distance in step_umap function (tidymodels)
我正在嘗試創建一個將使用自定義指標(骰子)的配方(Xgboost 模型的預處理)。 這是我的代碼: 骰子 function 和距離矩陣 工作流程 但我收到此錯誤: 該錯誤似乎來自等於 step_umap function 中的 X_dm 的子參數“X”。我不知道如何考慮 step_umap 中的自 ...
[英]How to enable parallelization in tidymodels stacks::control_stack_grid()
我正在嘗試使用tidymodels 堆棧package 來執行集成建模。 按照他們文章中提供的說明,我能夠成功地重現該示例。 但是,當我在代碼的“knn_res”部分的超參數調整期間添加並行化時: 我在運行代碼的“tree_frogs_model_st”部分時遇到錯誤: 錯誤消息指出: 我相信這個 ...
[英]How to speed up the tidymodels bootstrapping with parallelization
我有以下代碼,它執行自舉並計算置信區間。 它產生 但它運行非常緩慢。 我怎樣才能通過並行化來加速它? 注意並行化的 output 需要能夠被int_pctl()處理。 我試過這個但失敗了: ...
[英]Error in UseMethod("conf_mat") : no applicable method for 'conf_mat' applied to an object of class "list"
我目前正在嘗試在破產數據集上創建 TidyModel 邏輯回歸 model。 我一直在使用Rebecca Barters指南來創建設置。 這是我的第一個 model 像這樣,所以任何幫助表示贊賞。 嘗試創建 conf 時。 矩陣我收到以下錯誤: UseMethod("conf_mat") 錯誤:沒 ...
[英]Error in package "DALEXtra": Can't convert from `data$sqft` <double> to `sqft` <integer> due to loss of precision
我正在嘗試使用 R package DALEXtra 為tidymodels創建一個部分依賴DALEXtra ,但出現錯誤: Error in scream() : Can't convert from data$sqft to sqft due to loss of precision。 ...
[英]Can't update role of mutated variables
背景我正在使用 R package {recipes}進行數據預處理。 假設我想轉換一些變量,然后將轉換后的變量聲明為建模的結果變量。 問題和最小的例子: 但是,拋出錯誤:library(tidymodels) rec <- recipe( ~ ., data = mtcars) |> ...
[英]How to apply t-test between ranges of columns in R
我有一個看起來像這樣的大型數據集。 我想知道是否有一種聰明的方法可以在每一行中應用 t 檢驗,也就是基因,並比較人類和小鼠之間的計數。 我想在每一行中競爭 (human_A,human_B,human_C) vs (mouse_A,mouse_B)human_A = rnorm(20, 10, 1) ...
[英]Using parsnip to call multinomial_naive_bayes
我想使用 tidymodels 為 NLP 問題構建工作流程。 我有一個使用naivebayes package 以傳統方式構建的基本流程,它基本上將文檔術語矩陣(每個文檔中出現的術語計數)提供給multinomial_naive_bayes function。 雖然 naivebayes pac ...
[英]output step_lencode_mixed (from R package embed)
我對下面的示例代碼有三個問題,它說明了step_lencode_mixed的用法。 我在vi.nette中讀到:“對於每個因子預測變量,廣義線性 model 適合結果,系數作為編碼返回。” 在下面示例中的 output 中,“部分”列是從step_lencode_mixed返回的。 我的問題: 我 ...
[英]Using purrr to fit many survival models using tidymodels
我正在嘗試使用 tidymodels、工作流和 purr 來適應許多生存模型。 我可以讓這種方法適用於其他模型,例如線性回歸,但不適用於生存模型。 我已經將生存擴展加載到防風草中。 這是代碼生成一個小數據集。 證明通常的 cox-ph 工作正常。 使用 tidymodels 和工作流運行線性回歸並且 ...
[英]tidymodels roc auc results in multiple classification are affected by first level of factor
使用 iris 數據集,使用迭代搜索和 roc_auc 調整 knn 分類器作為多重分類的指標。 每個潛在 model 的一個 AUC 結果按預期計算,但是,該值不穩定,但受以下因素影響: 初始數據集中物種列中的levels ("setosa", "virginica", "versicolor") ...
[英]Neural network: predictions are just the same prediction despite changes in the model parameters
我想使用brulee擬合 neural.network,但盡管 model 參數發生了一些變化(所有參數發生變化),但我的預測值始終幾乎相同。 就我而言: 這對我來說聽起來很奇怪。 我將不勝感激任何幫助。 提前致謝! ...
[英]How do you run deep learning models with parsnip?
我已經探索了 R 防風草 package 提供的模型https://www.tidymodels.org/find/parsnip/但我找不到如何執行通用深度學習 model(我的意思是深層神經網絡。網絡)。 我能找到的最接近的是mlp和bag_mlp 。 相比之下,我知道插入符號 package ...
[英]Repeated Simulation of New Data Prediction with Tidymodels (Parsnip XGboost)
我有一個 model,稱為predictive_fit <- fit(workflow, training) ,它使用 xgboost 對 Iris 數據集物種進行分類。 數據旋轉很寬,因此每個物種都是一個由 0 或 1 表示的虛擬列。在這里,我試圖根據萼片和花瓣列來預測 Virginica。 ...
[英]How to aggregate rmse and cor in summarise() from tidymodels in R?
我有一個問題,我想在summarise()中同時計算rmse和cor 。 以下代碼運行良好。 但是下面的代碼報錯:no applicable method for 'rmse' applied to an object of class "c('integer', 'numeric')"。 我們該 ...
[英]How to use %>% and calculate multiple metrics in R?
我有一個問題,我正在嘗試計算多個指標。 稍微延伸一下這個問題,是否可以同時計算rmse和cor ? 感謝 jpsmith,是否可以將rmse和cor捆綁到一個summarise調用中? ...
[英]How to predict the test set's confidence interval using a tuned model from tidymodels in R?
我在 R 中使用tidymodels擬合隨機森林 model,當我嘗試使用調整后的 model 預測測試集時出現錯誤: splits的每個元素必須是一個rsplit object。 ...
[英]Why is my xgboost model tuning abysmally slow?
我正在嘗試調整 R 中的 xgboost 參數,並且在具有 8 核/16 處理器的 32GB RAM 機器上需要一天多的時間才能完成。 有人可以查看 reprex 並提出改進建議或指出荒謬或錯誤的地方嗎? tune_grid部分運行得非常慢。 注意:reprex 的運行時間不會超過一天。 它比我 ...