標簽[mutate] - 堆棧內存溢出

[英]Create a new column based on vectors pre-determined using case_when

我有一個名為“ sim ”的大數據框，它有一個名為“ CAUSABAS ”的字符列，如下所示：此 data.frame 是使用 package microdatasus創建的，如下所示：我想創建以下列： grupo_causa_basica ，對這些CAUSABAS進行分類。一些觀察有 3 個 ...

變異列占總數的 n% dataframe，按其他列 r 的降序排列

[英]Mutate column for n% of the total dataframe, in descending order of other column r

我有一個DF 我想使用以下方法將 dataframe 的 25% 的 var2 修改為“0.3”：但是，我希望按var3的降序選擇 25% 的數據，這樣 output 就是：其中行 IDS 6 和 7 已被修改，因為它們具有 Var3 的最高值和第二高值。它應該起作用，以便我可以改變突變的百分 ...

兩個成對列向量的行和，但以特定值為條件

[英]Rowsums on two vectors of paired columns but conditional on specific values

我有一個數據集，看起來像下面的數據集，其中有與類型（datA、datB、datC）相關的三“對”列，以及每種類型的總數（datA_total、datB_total、datC_total）：我正在嘗試在每一行中創建一個 rowSums，以確定每種數據類型的總訪問量，條件是它們是否滿足任何分數范圍 ( ...

使用 mutate in position 在特定的 position 添加一列 r

[英]Add a column at specific position using mutate in r

我想在 r 中的特定 position 添加一列，但是 mutate (xx, .before = "exisiting column) 不能正常工作：它創建一個“.before”列，而不是在第一列之前添加新列。我嘗試了 add_column()，它工作正常。但是我還是想知道為什么會出錯。 ...

Select 列基於另一列中的指標

[英]Select column based on indicator in another column

我在 R 中有一個 dataframe，其中有一列帶有數字指示符，我想根據該指示符從 dataframe 中的其他列中創建一個新列。如果我通過一個例子來解釋可能是最簡單的...... 我想根據指標中的數字從 columnx 列中選擇一個新列，即結束我試圖避免用很長的 ifelse 來做這件事，因 ...

dplyr mutate and purrr map：對 map 的 select 列使用數據屏蔽

[英]dplyr mutate and purrr map: use data masking to select columns for map

在 dplyr 突變上下文中，我想通過 purrr:map 使用另一列的值將 function 應用於 select 列。讓我們來一個測試數據框test <- data.frame(a = c(1,2), b = c(3,4), selector = c("a","b")) 我要申請以下f ...

dplyr 按變量分組的 n 級變異序列

[英]dplyr mutate sequence by n levels of grouping by variable

所以，我的數據如下所示：時期日期 1個 01-01-2020 1個 02-01-2020 1個 03-01-2020 2個 04-01-2020 2個 05-01-2020 2個 06-01-2020 3個 07-01-2020 3個 08-01-2020 3個 09-01-202 ...

使用 for 循環改變具有多個變量的結果

[英]Mutate results with multiple variables using for loop

我有這個 dataframe 如您所見，對於每個板中的每個標記，我有不同的 LOD 值。所以我計算每個標記的平均 LOD 使用這導致所有板的每個標記的以下平均 LOD 到目前為止，一切都很好。現在我想檢查我的標記結果是高於還是低於我的平均 LOD。如果高於我的平均 LOD，則不得更改結果，如 ...

Row 將多列綁定為兩列，按順序平均唯一元素

[英]Row bind multiple columns into two columns averaging unique elements in order

我仍在學習 R 並且想知道我是否有一種優雅的方式來操縱下面的 df 來實現 df2。我不確定它是否應該用於此循環，但基本上我想對每個 V(X)_ID 取一個不同的值並對其關聯的 V(X)_No 列進行平均。非常感謝您的幫助，因為我有數百種此類格式的列，並且從手動的角度來看它是非常耗費精力的。謝 ...

在R中，如何制作一個長數據集，其中包含一行適用的所有類別？

[英]In R, how do I make a long dataset that contains all the categories that a row applies to?

我有一個學生數據集，我想創建一個列，根據每個學生和其他學生在“主題”和“成績字母”列中的數據對每個學生進行分類，因為我最終想創建一個列，上面寫着“math_science_A”， “science_B”等，以了解有多少學生根據獨特的構成獲得了 A、B、C 等。我有一個學生可以擁有的所有潛在組合的 ...

在 R 中，如何獲得兩個變量的所有組合的總和？

[英]In R, how can I get the sum for all combinations of two variables?

我有一個包含學生成績和科目的長數據集。我想保留一個長數據集，但我想添加一個列，告訴我一個學生在他們的人文課程（英語和歷史）和他們的 STEM 課程（生物學和數學）中有多少 F。我也希望 Ds、Cs、Bs 和 As 也一樣。我知道我可以明確地說明這一點，但在未來，他們可能會有其他科目（比如將化 ...

如何識別 R 中兩個不同列中觀察結果相同的行？

[英]How to identify rows where observations are identical in two different columns in R?

我有兩列，我們稱它們為 start_id 和 end_id，每列都有字符串觀察值。它們的結構必須保持為 chr。這是在具有數百萬行的數據集中。我想創建一個新列來評估 start_id = end_id。如果它們相等，我希望它評估為 TRUE，如果不相等，則為 FALSE。我希望新列是永久 ...

根據 R 中其他列的存在向列表中的數據框添加一列

[英]Add a column to dataframes in a list based on the existence of other columns in R

我正在嘗試根據這些數據框中列的存在，向我擁有的列表（包含約 200 個數據框的長列表）中的所有數據框添加一個新列。以 iris 數據集的修改和未修改版本為例，我試圖為每個 dataframe 提供一個名為“species_fixed”的新列。我要遵循的規則是：如果“Species”列存在於 d ...

將數據格式從寬更改為長時卡住

[英]Got stuck while changing data format from wide to long

我是 R 的完全初學者。幾天前我安裝了 R 以完成我的課程作業。其中一項說明是我必須將數據格式從寬格式更改為長格式。該數據是 1972 年至 2021 年孟加拉國匯款流入的時間序列數據。我在行中列出了年份，在列中列出了來自不同國家/地區的匯款金額。我編寫了以下代碼將數據格式更改為長格式：這 ...

如何將值為 0、1 和 NA 的兩個 var 變異為 0 和 1 之和的 var？

[英]How to mutate two var with values 0, 1 & NA into a var with the sum of 0 and 1?

我遇到了一個問題，我想將兩個值為 0、1 和 NA 的變量突變為一個總和為 0 和 1 的新變量，但是，在我的例子中，R 將 NA 計為 0 或僅返回 NA。有沒有一個簡單的解決辦法，排除 NA？這些變量是大型數據集的一部分。在這個數據集中，我有一些調查實驗，這兩個變量是其中的一部分，這意味 ...

Row 將多列按順序綁定為包含唯一元素的兩列

[英]Row bind multiple columns into two columns containing unique elements in order

我對 R 還是不太熟悉，想知道是否有一種簡單的方法可以操縱下面的 df 來實現 df2。我不確定它是否應該用於此循環，但基本上我想在每個 V(X)_ID 列和它對應的 V(X)_No 列上采用不同的方式。如果 V(X)_ID 在其他列中重復，我想忽略它並移動下一個唯一的 V(X)_ID 及其關聯 ...

R - 變異從頂行中獲取第一個較小的值

[英]R - mutate getting the first smaller value from the top rows

所以，問題是，我試圖在轉換后的變量的頂行中獲取第一個較小的值。我的 df 看起來像：數數 24 33 33 34 35 33 34 35 ... 它只包含一列。我要找的output：數數關閉上一個 24 北美 33 24 33 24 34 33 35 34 3 ...

如何根據多個條件將 dataframe 中多個列中的所有值替換為來自不同 dataframe 的值？

[英]How do I replace all values in multiple columns in a dataframe with values from a different dataframe based on multiple conditions?

我想用 df_ref 中的相應值替換 df_skeleton 列中的所有值，不包括Date Time和ID列。 df_skeleton 中的值應根據以下條件替換為 df_ref 中的值： df_ref 列名包含 df_skeleton 列名 df_ref 列名稱包含在 df_skeleton ...

根據另一列中組的長度創建二進制變量

[英]Create binary variable based on length of group in another column

我需要根據名為“cluster”的變量的長度創建一個名為 flow.type 的二進制變量。如果簇的長度為 1，則 flow.type 應為“0”，如果 >1，則 flow.type 應為“1”。我已經在圖像中放置了我的數據示例，但如果有辦法將數據附加到我的問題，請告訴我，我會盡快這樣做。 ...

如何在R的dplyr pipe的變異中使用hashmap的查詢function？

[英]How to use query function of hashmap in mutate of dplyr pipe in R?

我想使用 hashmap 找到一個值，然后使用該值計算一個新值。平時我盡量高效工作，但我對R不是很精通。我知道dplyr管道的基礎，所以不想再使用for循環了。這是這種情況的最小可重現示例：不幸的是，我收到此錯誤：請注意，這是有效的： score1=query(testmap, m.sub ...