標簽[forcats] - 堆棧內存溢出

[英]Conditionally replace levels of factor variable 1 for a specific variable 2

在我的例子中：我想在變量FARM中只LIBERTY2因子進行條件變異，並在另一個變量中使用規則：如果AGE等於 10 而不是 3，如果AGE等於 9 而不是 2，如果AGE等於 8 而不是 1。請幫我。 ...

`fct_reorder()` 中的錯誤：。 `,f` 必須是因子或字符向量，而不是數據框 - 嘗試重新排序條 plot

[英]Error in `fct_reorder()`: ! `.f` must be a factor or character vector, not a data frame - trying to reorder a bar plot

我有一個匯總表，其中包含 940 行數據集中的 4 個變量的平均值：我想把它們 plot 變成一個簡單的欄 plot，但是活動強度的級別（久坐 - 輕度活躍 - 相當活躍 - 非常活躍）顯得雜亂無章：我嘗試按照R 圖表庫中的指南按照第二個變量的值重新排序柱 plot：但是當我運行最后一個塊 ...

嘗試將 fct_collapse() 與 class 日期一起使用，必須是因子或字符向量，而不是 s3 object

[英]attempt to use fct_collapse() with class Date, must be factor or character vector, not an s3 object

我有一個我想要的數據集 plot，它需要對日期進行一些簡化，這將是我的 x 軸。現在我有從 2020 年 3 月到 2022 年 11 月的每一天，但我想使用手動定義的 6 個月期間組，剩下的只是例外（這是我在這里的第一個問題，如果需要更多上下文，請告訴我). 無論如何，我的直覺是使用 fct_ ...

根據分組權重保留最重要的因素

[英]Keep Top Factors based on Grouped Weight

請查看帖子末尾的片段。我本質上是在尋找一種更清潔的方法來獲得相同的結果。我有一個小標題，其中 x 列是一個字符向量（我沒有將它轉換為一個因子，但這實際上就是它的樣子）。每個因素出現多次，並且總是有一個相關的數值（tibble 中的 w 列）。我想根據相關 w 值的總和保留前 4 個因素，並將 ...

當一個水平內的觀察數量低於限制時，因子的折疊水平

[英]Collapse levels of a factor when number of observations within a level are below a limit

我想要一種基於每個級別的觀察數量來折疊因子級別的方法。例如，如果我在下面有一個動物因子列（四個級別：貓、狗、倉鼠、金魚）的小標題，我可以將少於 2 個觀察值的級別折疊成一個稱為“其他”的級別嗎？這應該導致以下... 我希望能夠調整截止值（例如，觀察次數少於 5 的組），理想情況下，這將使用 ti ...

使用 R 中的分層組重新排序因子（在表中）

[英]Re-ordering a factor (in a table) with hierarchical groups in R

假設下表包含兩個因子變量和一個數值變量：我想重新排序y使得val的總和在按x分組時優先，但y仍然按val排序。為了說明目標：但是我怎么去那里？在 tidyverse 中，我嘗試使用forcats::fct_reorder()解決它，認為分組可能會有所幫助（ df |> group_b ...

改變一個因素的一個水平后一個水平

[英]Change a level of a factor after another level

我想改變一個因素的水平順序，以便一個特定的水平緊跟在另一個水平之后，但我正在努力如何有效地做到這一點。假設我們想改變以下因子的水平，使“20”緊跟在“10”之后。所以我嘗試了這個並成功地得到了預期的結果：library(tidyverse) sample_factor <- factor ...

使用 forcats::fct_infreq() 后使用因子重新排序調色板

[英]Reordering color palette with factors after using forcats::fct_infreq()

我正在使用geom_histogram顯示一些調查數據，並希望使用forcats::fct_infreq按因子的出現進行排序。我正在使用自定義調色板來匹配主題，不幸的是順序調色板變得混亂。由於某種原因，只是重新排序調色板以匹配因素的順序似乎也不起作用。下面的例子。希望有人可以為這個相對較 ...

對數據子集使用 fct_collapse

[英]Using fct_collapse on a subset of data

我正在嘗試建立預測 model。我的功能之一是美國各州和地區的標識符。原始列表有 62 個唯一值，我可以使用 fct_collapse 將它們減少到 5 個值。尾巴（數據，10）小標題：10 x 2 state 人口普查區 TX 南美國本土外小島嶼其他 UT 西方弗吉尼亞州南六其他 VT ...

tidyverse 中的組低計數 R

[英]Group low counts in tidyverse R

我目前正在處理一個包含 714 行的 tibble 格式的數據集（每行對應一個特定於給定病毒的新序列，但如果有意義的話，多個序列來自同一病毒）。因此，如果您查看數據，例如有 21 個 B19 序列。我想在我的 tibble 中創建一個新專欄，我將所有存在幾次（低於 50 計數）的病毒株歸為一組 ...

根據代碼列表折疊組

[英]Collapse groups according to a list of codes

我有一個應該折疊的逗號分隔代碼表以及應該在其上運行折疊和求和的表：第三行將保持不變，它不在要折疊的代碼列表中。預期的結果是列表中代碼的折疊並對它們的值求和。我期待在 group-by 之后運行崩潰。代碼不會重復。在大多數情況下，它們可能會彼此跟隨，但順序未知（數據來自手動輸入表格。最好的 ...

在 R 方法中，在標記具有多個級別的因子時減少可能的錯誤

[英]In R methods to reduce possible error when labeling a factor with many levels

我有一個包含 75 個級別的變量，我想對其進行格式化。但是，我發現如果不錯誤地格式化級別就很難做到這一點。如您所知，使用其水平創建一個因子是這樣完成的：有沒有辦法對此進行不同的編碼，以便將 label 寫在關卡旁邊。我正在尋找這種結構中的代碼：謝謝轉發 ...

為什么 R 中的 levels() 沒有為我的數據分配錯誤的級別？

[英]Why is levels() in R not assigning the wrong level to my data?

我正在創建一個 function ，它要求用戶上傳具有特定字符向量的數據集。在引擎蓋下，我需要一個具有矢量保持字符的列，但我還需要一個相同的單獨列，除了它是具有特定級別的因素。當我嘗試使用 levels() 分配級別時，我假設 R 會匹配字符串，但它是隨機分配級別的順序。我該如何糾正這種行為 ...

如何使用 fct_relabel 但保持原始因子水平？或者如何在 R 中設置具有部分字符串匹配的因子級別？

[英]How can I use fct_relabel but maintain original factor levels? Or how can I set factor levels in R with partial string matches?

我正在嘗試使用來自forcats的fct_relabel()來重新標記我的因子以包括因子名稱和位於其中的行數，但是當我使用 function 時，它完全改變了我設置為列出現順序的級別. 我怎樣才能覆蓋這個？我原來的名字是一致的（例如，動物的名字），但數量會有所不同。因此，我不能依靠新標簽名稱手 ...

R forcats - 是否可以在 fct_lump 中重命名“其他”？

[英]R forcats - Is it possible to rename "other" in fct_lump?

使用 fct_lump 對變量進行分組我需要將分組數據“其他”重命名，這可能嗎？如果是這樣，如何實現？謝謝 ...

在 R 中，關於將變量類型更改為“因子”的問題

[英]In R , a question about change variable type to 'factor'

我使用下面的代碼將變量“期間”從“字符”更改為“因子”（以及因子級別序列以匹配“期間”文本中包含的順序）。下面是當前的代碼。它有可用的功能嗎？ ...

使用 dplyr 和 forcats 包根據分組變量中的值更改因子級別

[英]Changing the factor level based on the value in a grouped variable using the dplyr and forcats packages

我正在嘗試根據來自另一個變量的某些值來更改因子的級別。我將在一個例子中展示它。我有一個這樣的表：我想在變量x的標准偏差的遞減值中更改group因子的級別。我設法得到它是這樣的：但是，我不喜歡這個解決方案，因為它需要創建一個輔助lev表，我想避免這種情況。有誰知道如何以dplyr ...

fct_reorder 按功能僅用於一組

[英]fct_reorder by function for only one group

我在縣內擁有一所公立和私立學校，每所學校都有一個指定的值。我想使用forcats::fct_reorder按中值重新排列縣，但僅適用於私立學校。使用默認的forcats::fct_reorder按總中位數排列，這對我正在做的事情不太有用。在這里重現：期望的產出只會通過增加私立學校的中位 ...

使用 fct_collapse 標記值並僅對數據框列表中的一組運行回歸

[英]Labeling values using fct_collapse and running regressions for only a group within a data frame list

我正在嘗試用列表做多項事情。對於可重現的示例，我將使用 Iris。例如，假設我有一個包含多個 iris 數據集的列表。就我而言，值不同。對於此示例，使用 iris*2 不起作用，因為當您進行乘法運算時，物種會返回 NA。假設它們是不同的。 Iris1 <- iris Iris2 & ...

R - 將 forcats fct_collapse 與 tidyselect 選擇助手結合使用

[英]R - Using forcats fct_collapse in combination with tidyselect selection helpers

我有一個雜亂的因子變量，其中包含各種非常相似的因子水平（例如，由拼寫錯誤、略有不同的措辭等引入）。我正在嘗試使用來自 forcats package 的 fct_collapse function 將該因素合並為四個主要類別。然而，考慮到可變性的數量，我想將 fct_collapse funct ...