cost 147 ms
有條件地替換特定變量 2 的因子變量 1 的水平

[英]Conditionally replace levels of factor variable 1 for a specific variable 2

在我的例子中: 我想在變量FARM中只LIBERTY2因子進行條件變異,並在另一個變量中使用規則:如果AGE等於 10 而不是 3,如果AGE等於 9 而不是 2,如果AGE等於 8 而不是 1。 請幫我。 ...

`fct_reorder()` 中的錯誤:。 `,f` 必須是因子或字符向量,而不是數據框 - 嘗試重新排序條 plot

[英]Error in `fct_reorder()`: ! `.f` must be a factor or character vector, not a data frame - trying to reorder a bar plot

我有一個匯總表,其中包含 940 行數據集中的 4 個變量的平均值: 我想把它們 plot 變成一個簡單的欄 plot,但是活動強度的級別(久坐 - 輕度活躍 - 相當活躍 - 非常活躍)顯得雜亂無章: 我嘗試按照R 圖表庫中的指南按照第二個變量的值重新排序柱 plot: 但是當我運行最后一個塊 ...

嘗試將 fct_collapse() 與 class 日期一起使用,必須是因子或字符向量,而不是 s3 object

[英]attempt to use fct_collapse() with class Date, must be factor or character vector, not an s3 object

我有一個我想要的數據集 plot,它需要對日期進行一些簡化,這將是我的 x 軸。 現在我有從 2020 年 3 月到 2022 年 11 月的每一天,但我想使用手動定義的 6 個月期間組,剩下的只是例外(這是我在這里的第一個問題,如果需要更多上下文,請告訴我). 無論如何,我的直覺是使用 fct_ ...

2022-11-15 19:35:44   1   37    r / forcats  
根據分組權重保留最重要的因素

[英]Keep Top Factors based on Grouped Weight

請查看帖子末尾的片段。 我本質上是在尋找一種更清潔的方法來獲得相同的結果。 我有一個小標題,其中 x 列是一個字符向量(我沒有將它轉換為一個因子,但這實際上就是它的樣子)。 每個因素出現多次,並且總是有一個相關的數值(tibble 中的 w 列)。 我想根據相關 w 值的總和保留前 4 個因素,並將 ...

2022-09-16 13:24:36   1   20    r / forcats  
當一個水平內的觀察數量低於限制時,因子的折疊水平

[英]Collapse levels of a factor when number of observations within a level are below a limit

我想要一種基於每個級別的觀察數量來折疊因子級別的方法。 例如,如果我在下面有一個動物因子列(四個級別:貓、狗、倉鼠、金魚)的小標題,我可以將少於 2 個觀察值的級別折疊成一個稱為“其他”的級別嗎? 這應該導致以下... 我希望能夠調整截止值(例如,觀察次數少於 5 的組),理想情況下,這將使用 ti ...

使用 R 中的分層組重新排序因子(在表中)

[英]Re-ordering a factor (in a table) with hierarchical groups in R

假設下表包含兩個因子變量和一個數值變量: 我想重新排序y使得val的總和在按x分組時優先,但y仍然按val排序。 為了說明目標: 但是我怎么去那里? 在 tidyverse 中,我嘗試使用forcats::fct_reorder()解決它,認為分組可能會有所幫助( df |> group_b ...

改變一個因素的一個水平后一個水平

[英]Change a level of a factor after another level

我想改變一個因素的水平順序,以便一個特定的水平緊跟在另一個水平之后,但我正在努力如何有效地做到這一點。 假設我們想改變以下因子的水平,使“20”緊跟在“10”之后。 所以我嘗試了這個並成功地得到了預期的結果:library(tidyverse) sample_factor <- factor ...

2022-08-18 00:49:37   2   33    r / forcats  
使用 forcats::fct_infreq() 后使用因子重新排序調色板

[英]Reordering color palette with factors after using forcats::fct_infreq()

我正在使用geom_histogram顯示一些調查數據,並希望使用forcats::fct_infreq按因子的出現進行排序。 我正在使用自定義調色板來匹配主題,不幸的是順序調色板變得混亂。 由於某種原因,只是重新排序調色板以匹配因素的順序似乎也不起作用。 下面的例子。 希望有人可以為這個相對較 ...

對數據子集使用 fct_collapse

[英]Using fct_collapse on a subset of data

我正在嘗試建立預測 model。我的功能之一是美國各州和地區的標識符。 原始列表有 62 個唯一值,我可以使用 fct_collapse 將它們減少到 5 個值。 尾巴(數據,10) 小標題:10 x 2 state 人口普查區 TX 南美國本土外小島嶼其他 UT 西方弗吉尼亞州南六其他 VT ...

2022-05-18 19:40:26   1   46    r / forcats  
tidyverse 中的組低計數 R

[英]Group low counts in tidyverse R

我目前正在處理一個包含 714 行的 tibble 格式的數據集(每行對應一個特定於給定病毒的新序列,但如果有意義的話,多個序列來自同一病毒)。 因此,如果您查看數據,例如有 21 個 B19 序列。 我想在我的 tibble 中創建一個新專欄,我將所有存在幾次(低於 50 計數)的病毒株歸為一組 ...

根據代碼列表折疊組

[英]Collapse groups according to a list of codes

我有一個應該折疊的逗號分隔代碼表 以及應該在其上運行折疊和求和的表: 第三行將保持不變,它不在要折疊的代碼列表中。 預期的結果是列表中代碼的折疊並對它們的值求和。 我期待在 group-by 之后運行崩潰。 代碼不會重復。 在大多數情況下,它們可能會彼此跟隨,但順序未知(數據來自手動輸入表格。最好的 ...

在 R 方法中,在標記具有多個級別的因子時減少可能的錯誤

[英]In R methods to reduce possible error when labeling a factor with many levels

我有一個包含 75 個級別的變量,我想對其進行格式化。 但是,我發現如果不錯誤地格式化級別就很難做到這一點。 如您所知,使用其水平創建一個因子是這樣完成的: 有沒有辦法對此進行不同的編碼,以便將 label 寫在關卡旁邊。 我正在尋找這種結構中的代碼: 謝謝轉發 ...

為什么 R 中的 levels() 沒有為我的數據分配錯誤的級別?

[英]Why is levels() in R not assigning the wrong level to my data?

我正在創建一個 function ,它要求用戶上傳具有特定字符向量的數據集。 在引擎蓋下,我需要一個具有矢量保持字符的列,但我還需要一個相同的單獨列,除了它是具有特定級別的因素。 當我嘗試使用 levels() 分配級別時,我假設 R 會匹配字符串,但它是隨機分配級別的順序。 我該如何糾正這種行為 ...

如何使用 fct_relabel 但保持原始因子水平? 或者如何在 R 中設置具有部分字符串匹配的因子級別?

[英]How can I use fct_relabel but maintain original factor levels? Or how can I set factor levels in R with partial string matches?

我正在嘗試使用來自forcats的fct_relabel()來重新標記我的因子以包括因子名稱和位於其中的行數,但是當我使用 function 時,它完全改變了我設置為列出現順序的級別. 我怎樣才能覆蓋這個? 我原來的名字是一致的(例如,動物的名字),但數量會有所不同。 因此,我不能依靠新標簽名稱手 ...

在 R 中,關於將變量類型更改為“因子”的問題

[英]In R , a question about change variable type to 'factor'

我使用下面的代碼將變量“期間”從“字符”更改為“因子”(以及因子級別序列以匹配“期間”文本中包含的順序)。 下面是當前的代碼。 它有可用的功能嗎? ...

2021-11-04 08:37:00   3   50    r / forcats  
使用 dplyr 和 forcats 包根據分組變量中的值更改因子級別

[英]Changing the factor level based on the value in a grouped variable using the dplyr and forcats packages

我正在嘗試根據來自另一個變量的某些值來更改因子的級別。 我將在一個例子中展示它。 我有一個這樣的表: 我想在變量x的標准偏差的遞減值中更改group因子的級別。 我設法得到它是這樣的: 但是,我不喜歡這個解決方案,因為它需要創建一個輔助lev表,我想避免這種情況。 有誰知道如何以dplyr ...

fct_reorder 按功能僅用於一組

[英]fct_reorder by function for only one group

我在縣內擁有一所公立和私立學校,每所學校都有一個指定的值。 我想使用forcats::fct_reorder按中值重新排列縣,但僅適用於私立學校。 使用默認的forcats::fct_reorder按總中位數排列,這對我正在做的事情不太有用。 在這里重現: 期望的產出只會通過增加私立學校的中位 ...

使用 fct_collapse 標記值並僅對數據框列表中的一組運行回歸

[英]Labeling values using fct_collapse and running regressions for only a group within a data frame list

我正在嘗試用列表做多項事情。 對於可重現的示例,我將使用 Iris。 例如,假設我有一個包含多個 iris 數據集的列表。 就我而言,值不同。 對於此示例,使用 iris*2 不起作用,因為當您進行乘法運算時,物種會返回 NA。 假設它們是不同的。 Iris1 <- iris Iris2 & ...

R - 將 forcats fct_collapse 與 tidyselect 選擇助手結合使用

[英]R - Using forcats fct_collapse in combination with tidyselect selection helpers

我有一個雜亂的因子變量,其中包含各種非常相似的因子水平(例如,由拼寫錯誤、略有不同的措辭等引入)。 我正在嘗試使用來自 forcats package 的 fct_collapse function 將該因素合並為四個主要類別。 然而,考慮到可變性的數量,我想將 fct_collapse funct ...


 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM