![](/img/trans.png)
[英]Conditionally replace levels of factor variable 1 for a specific variable 2
在我的例子中: 我想在變量FARM中只LIBERTY2因子進行條件變異,並在另一個變量中使用規則:如果AGE等於 10 而不是 3,如果AGE等於 9 而不是 2,如果AGE等於 8 而不是 1。 請幫我。 ...
[英]Conditionally replace levels of factor variable 1 for a specific variable 2
在我的例子中: 我想在變量FARM中只LIBERTY2因子進行條件變異,並在另一個變量中使用規則:如果AGE等於 10 而不是 3,如果AGE等於 9 而不是 2,如果AGE等於 8 而不是 1。 請幫我。 ...
[英]Error in `fct_reorder()`: ! `.f` must be a factor or character vector, not a data frame - trying to reorder a bar plot
我有一個匯總表,其中包含 940 行數據集中的 4 個變量的平均值: 我想把它們 plot 變成一個簡單的欄 plot,但是活動強度的級別(久坐 - 輕度活躍 - 相當活躍 - 非常活躍)顯得雜亂無章: 我嘗試按照R 圖表庫中的指南按照第二個變量的值重新排序柱 plot: 但是當我運行最后一個塊 ...
[英]attempt to use fct_collapse() with class Date, must be factor or character vector, not an s3 object
我有一個我想要的數據集 plot,它需要對日期進行一些簡化,這將是我的 x 軸。 現在我有從 2020 年 3 月到 2022 年 11 月的每一天,但我想使用手動定義的 6 個月期間組,剩下的只是例外(這是我在這里的第一個問題,如果需要更多上下文,請告訴我). 無論如何,我的直覺是使用 fct_ ...
[英]Keep Top Factors based on Grouped Weight
請查看帖子末尾的片段。 我本質上是在尋找一種更清潔的方法來獲得相同的結果。 我有一個小標題,其中 x 列是一個字符向量(我沒有將它轉換為一個因子,但這實際上就是它的樣子)。 每個因素出現多次,並且總是有一個相關的數值(tibble 中的 w 列)。 我想根據相關 w 值的總和保留前 4 個因素,並將 ...
[英]Collapse levels of a factor when number of observations within a level are below a limit
我想要一種基於每個級別的觀察數量來折疊因子級別的方法。 例如,如果我在下面有一個動物因子列(四個級別:貓、狗、倉鼠、金魚)的小標題,我可以將少於 2 個觀察值的級別折疊成一個稱為“其他”的級別嗎? 這應該導致以下... 我希望能夠調整截止值(例如,觀察次數少於 5 的組),理想情況下,這將使用 ti ...
[英]Re-ordering a factor (in a table) with hierarchical groups in R
假設下表包含兩個因子變量和一個數值變量: 我想重新排序y使得val的總和在按x分組時優先,但y仍然按val排序。 為了說明目標: 但是我怎么去那里? 在 tidyverse 中,我嘗試使用forcats::fct_reorder()解決它,認為分組可能會有所幫助( df |> group_b ...
[英]Change a level of a factor after another level
我想改變一個因素的水平順序,以便一個特定的水平緊跟在另一個水平之后,但我正在努力如何有效地做到這一點。 假設我們想改變以下因子的水平,使“20”緊跟在“10”之后。 所以我嘗試了這個並成功地得到了預期的結果:library(tidyverse) sample_factor <- factor ...
[英]Reordering color palette with factors after using forcats::fct_infreq()
我正在使用geom_histogram顯示一些調查數據,並希望使用forcats::fct_infreq按因子的出現進行排序。 我正在使用自定義調色板來匹配主題,不幸的是順序調色板變得混亂。 由於某種原因,只是重新排序調色板以匹配因素的順序似乎也不起作用。 下面的例子。 希望有人可以為這個相對較 ...
[英]Using fct_collapse on a subset of data
我正在嘗試建立預測 model。我的功能之一是美國各州和地區的標識符。 原始列表有 62 個唯一值,我可以使用 fct_collapse 將它們減少到 5 個值。 尾巴(數據,10) 小標題:10 x 2 state 人口普查區 TX 南美國本土外小島嶼其他 UT 西方弗吉尼亞州南六其他 VT ...
[英]Group low counts in tidyverse R
我目前正在處理一個包含 714 行的 tibble 格式的數據集(每行對應一個特定於給定病毒的新序列,但如果有意義的話,多個序列來自同一病毒)。 因此,如果您查看數據,例如有 21 個 B19 序列。 我想在我的 tibble 中創建一個新專欄,我將所有存在幾次(低於 50 計數)的病毒株歸為一組 ...
[英]Collapse groups according to a list of codes
我有一個應該折疊的逗號分隔代碼表 以及應該在其上運行折疊和求和的表: 第三行將保持不變,它不在要折疊的代碼列表中。 預期的結果是列表中代碼的折疊並對它們的值求和。 我期待在 group-by 之后運行崩潰。 代碼不會重復。 在大多數情況下,它們可能會彼此跟隨,但順序未知(數據來自手動輸入表格。最好的 ...
[英]In R methods to reduce possible error when labeling a factor with many levels
我有一個包含 75 個級別的變量,我想對其進行格式化。 但是,我發現如果不錯誤地格式化級別就很難做到這一點。 如您所知,使用其水平創建一個因子是這樣完成的: 有沒有辦法對此進行不同的編碼,以便將 label 寫在關卡旁邊。 我正在尋找這種結構中的代碼: 謝謝轉發 ...
[英]Why is levels() in R not assigning the wrong level to my data?
我正在創建一個 function ,它要求用戶上傳具有特定字符向量的數據集。 在引擎蓋下,我需要一個具有矢量保持字符的列,但我還需要一個相同的單獨列,除了它是具有特定級別的因素。 當我嘗試使用 levels() 分配級別時,我假設 R 會匹配字符串,但它是隨機分配級別的順序。 我該如何糾正這種行為 ...
[英]How can I use fct_relabel but maintain original factor levels? Or how can I set factor levels in R with partial string matches?
我正在嘗試使用來自forcats的fct_relabel()來重新標記我的因子以包括因子名稱和位於其中的行數,但是當我使用 function 時,它完全改變了我設置為列出現順序的級別. 我怎樣才能覆蓋這個? 我原來的名字是一致的(例如,動物的名字),但數量會有所不同。 因此,我不能依靠新標簽名稱手 ...
[英]R forcats - Is it possible to rename "other" in fct_lump?
使用 fct_lump 對變量進行分組我需要將分組數據“其他”重命名,這可能嗎? 如果是這樣,如何實現? 謝謝 ...
[英]In R , a question about change variable type to 'factor'
我使用下面的代碼將變量“期間”從“字符”更改為“因子”(以及因子級別序列以匹配“期間”文本中包含的順序)。 下面是當前的代碼。 它有可用的功能嗎? ...
[英]Changing the factor level based on the value in a grouped variable using the dplyr and forcats packages
我正在嘗試根據來自另一個變量的某些值來更改因子的級別。 我將在一個例子中展示它。 我有一個這樣的表: 我想在變量x的標准偏差的遞減值中更改group因子的級別。 我設法得到它是這樣的: 但是,我不喜歡這個解決方案,因為它需要創建一個輔助lev表,我想避免這種情況。 有誰知道如何以dplyr ...
[英]fct_reorder by function for only one group
我在縣內擁有一所公立和私立學校,每所學校都有一個指定的值。 我想使用forcats::fct_reorder按中值重新排列縣,但僅適用於私立學校。 使用默認的forcats::fct_reorder按總中位數排列,這對我正在做的事情不太有用。 在這里重現: 期望的產出只會通過增加私立學校的中位 ...
[英]Labeling values using fct_collapse and running regressions for only a group within a data frame list
我正在嘗試用列表做多項事情。 對於可重現的示例,我將使用 Iris。 例如,假設我有一個包含多個 iris 數據集的列表。 就我而言,值不同。 對於此示例,使用 iris*2 不起作用,因為當您進行乘法運算時,物種會返回 NA。 假設它們是不同的。 Iris1 <- iris Iris2 & ...
[英]R - Using forcats fct_collapse in combination with tidyselect selection helpers
我有一個雜亂的因子變量,其中包含各種非常相似的因子水平(例如,由拼寫錯誤、略有不同的措辭等引入)。 我正在嘗試使用來自 forcats package 的 fct_collapse function 將該因素合並為四個主要類別。 然而,考慮到可變性的數量,我想將 fct_collapse funct ...