cost 235 ms
基於使用 case_when 預先確定的向量創建新列

[英]Create a new column based on vectors pre-determined using case_when

我有一個名為“ sim ”的大數據框,它有一個名為“ CAUSABAS ”的字符列,如下所示: 此 data.frame 是使用 package microdatasus創建的,如下所示: 我想創建以下列: grupo_causa_basica ,對這些CAUSABAS進行分類。 一些觀察有 3 個 ...

變異列占總數的 n% dataframe,按其他列 r 的降序排列

[英]Mutate column for n% of the total dataframe, in descending order of other column r

我有一個DF 我想使用以下方法將 dataframe 的 25% 的 var2 修改為“0.3”: 但是,我希望按var3的降序選擇 25% 的數據,這樣 output 就是: 其中行 IDS 6 和 7 已被修改,因為它們具有 Var3 的最高值和第二高值。 它應該起作用,以便我可以改變突變的百分 ...

兩個成對列向量的行和,但以特定值為條件

[英]Rowsums on two vectors of paired columns but conditional on specific values

我有一個數據集,看起來像下面的數據集,其中有與類型(datA、datB、datC)相關的三“對”列,以及每種類型的總數(datA_total、datB_total、datC_total): 我正在嘗試在每一行中創建一個 rowSums,以確定每種數據類型的總訪問量,條件是它們是否滿足任何分數范圍 ( ...

使用 mutate in position 在特定的 position 添加一列 r

[英]Add a column at specific position using mutate in r

我想在 r 中的特定 position 添加一列,但是 mutate (xx, .before = "exisiting column) 不能正常工作: 它創建一個“.before”列,而不是在第一列之前添加新列。 我嘗試了 add_column(),它工作正常。 但是我還是想知道為什么會出錯。 ...

Select 列基於另一列中的指標

[英]Select column based on indicator in another column

我在 R 中有一個 dataframe,其中有一列帶有數字指示符,我想根據該指示符從 dataframe 中的其他列中創建一個新列。 如果我通過一個例子來解釋可能是最簡單的...... 我想根據指標中的數字從 columnx 列中選擇一個新列,即結束 我試圖避免用很長的 ifelse 來做這件事,因 ...

2023-01-30 12:23:15   3   45    r / mutate  
dplyr mutate and purrr map:對 map 的 select 列使用數據屏蔽

[英]dplyr mutate and purrr map: use data masking to select columns for map

在 dplyr 突變上下文中,我想通過 purrr:map 使用另一列的值將 function 應用於 select 列。 讓我們來一個測試數據框test <- data.frame(a = c(1,2), b = c(3,4), selector = c("a","b")) 我要申請以下f ...

dplyr 按變量分組的 n 級變異序列

[英]dplyr mutate sequence by n levels of grouping by variable

所以,我的數據如下所示: 時期日期 1個 01-01-2020 1個 02-01-2020 1個 03-01-2020 2個 04-01-2020 2個 05-01-2020 2個 06-01-2020 3個 07-01-2020 3個 08-01-2020 3個 09-01-202 ...

使用 for 循環改變具有多個變量的結果

[英]Mutate results with multiple variables using for loop

我有這個 dataframe 如您所見,對於每個板中的每個標記,我有不同的 LOD 值。 所以我計算每個標記的平均 LOD 使用 這導致所有板的每個標記的以下平均 LOD 到目前為止,一切都很好。 現在我想檢查我的標記結果是高於還是低於我的平均 LOD。 如果高於我的平均 LOD,則不得更改結果,如 ...

Row 將多列綁定為兩列,按順序平均唯一元素

[英]Row bind multiple columns into two columns averaging unique elements in order

我仍在學習 R 並且想知道我是否有一種優雅的方式來操縱下面的 df 來實現 df2。 我不確定它是否應該用於此循環,但基本上我想對每個 V(X)_ID 取一個不同的值並對其關聯的 V(X)_No 列進行平均。 非常感謝您的幫助,因為我有數百種此類格式的列,並且從手動的角度來看它是非常耗費精力的。 謝 ...

在R中,如何制作一個長數據集,其中包含一行適用的所有類別?

[英]In R, how do I make a long dataset that contains all the categories that a row applies to?

我有一個學生數據集,我想創建一個列,根據每個學生和其他學生在“主題”和“成績字母”列中的數據對每個學生進行分類,因為我最終想創建一個列,上面寫着“math_science_A”, “science_B”等,以了解有多少學生根據獨特的構成獲得了 A、B、C 等。 我有一個學生可以擁有的所有潛在組合的 ...

在 R 中,如何獲得兩個變量的所有組合的總和?

[英]In R, how can I get the sum for all combinations of two variables?

我有一個包含學生成績和科目的長數據集。 我想保留一個長數據集,但我想添加一個列,告訴我一個學生在他們的人文課程(英語和歷史)和他們的 STEM 課程(生物學和數學)中有多少 F。 我也希望 Ds、Cs、Bs 和 As 也一樣。 我知道我可以明確地說明這一點,但在未來,他們可能會有其他科目(比如將化 ...

如何識別 R 中兩個不同列中觀察結果相同的行?

[英]How to identify rows where observations are identical in two different columns in R?

我有兩列,我們稱它們為 start_id 和 end_id,每列都有字符串觀察值。 它們的結構必須保持為 chr。 這是在具有數百萬行的數據集中。 我想創建一個新列來評估 start_id = end_id。 如果它們相等,我希望它評估為 TRUE,如果不相等,則為 FALSE。 我希望新列是永久 ...

根據 R 中其他列的存在向列表中的數據框添加一列

[英]Add a column to dataframes in a list based on the existence of other columns in R

我正在嘗試根據這些數據框中列的存在,向我擁有的列表(包含約 200 個數據框的長列表)中的所有數據框添加一個新列。 以 iris 數據集的修改和未修改版本為例,我試圖為每個 dataframe 提供一個名為“species_fixed”的新列。 我要遵循的規則是: 如果“Species”列存在於 d ...

將數據格式從寬更改為長時卡住

[英]Got stuck while changing data format from wide to long

我是 R 的完全初學者。幾天前我安裝了 R 以完成我的課程作業。 其中一項說明是我必須將數據格式從寬格式更改為長格式。 該數據是 1972 年至 2021 年孟加拉國匯款流入的時間序列數據。 我在行中列出了年份,在列中列出了來自不同國家/地區的匯款金額。 我編寫了以下代碼將數據格式更改為長格式: 這 ...

如何將值為 0、1 和 NA 的兩個 var 變異為 0 和 1 之和的 var?

[英]How to mutate two var with values 0, 1 & NA into a var with the sum of 0 and 1?

我遇到了一個問題,我想將兩個值為 0、1 和 NA 的變量突變為一個總和為 0 和 1 的新變量,但是,在我的例子中,R 將 NA 計為 0 或僅返回 NA。 有沒有一個簡單的解決辦法,排除 NA? 這些變量是大型數據集的一部分。 在這個數據集中,我有一些調查實驗,這兩個變量是其中的一部分,這意味 ...

Row 將多列按順序綁定為包含唯一元素的兩列

[英]Row bind multiple columns into two columns containing unique elements in order

我對 R 還是不太熟悉,想知道是否有一種簡單的方法可以操縱下面的 df 來實現 df2。 我不確定它是否應該用於此循環,但基本上我想在每個 V(X)_ID 列和它對應的 V(X)_No 列上采用不同的方式。 如果 V(X)_ID 在其他列中重復,我想忽略它並移動下一個唯一的 V(X)_ID 及其關聯 ...

R - 變異從頂行中獲取第一個較小的值

[英]R - mutate getting the first smaller value from the top rows

所以,問題是,我試圖在轉換后的變量的頂行中獲取第一個較小的值。 我的 df 看起來像: 數數 24 33 33 34 35 33 34 35 ... 它只包含一列。 我要找的output: 數數關閉上一個 24 北美 33 24 33 24 34 33 35 34 3 ...

2023-01-20 10:26:37   2   38    r / mutate  
如何根據多個條件將 dataframe 中多個列中的所有值替換為來自不同 dataframe 的值?

[英]How do I replace all values in multiple columns in a dataframe with values from a different dataframe based on multiple conditions?

我想用 df_ref 中的相應值替換 df_skeleton 列中的所有值,不包括Date Time和ID列。 df_skeleton 中的值應根據以下條件替換為 df_ref 中的值: df_ref 列名包含 df_skeleton 列名 df_ref 列名稱包含在 df_skeleton ...

根據另一列中組的長度創建二進制變量

[英]Create binary variable based on length of group in another column

我需要根據名為“cluster”的變量的長度創建一個名為 flow.type 的二進制變量。 如果簇的長度為 1,則 flow.type 應為“0”,如果 >1,則 flow.type 應為“1”。 我已經在圖像中放置了我的數據示例,但如果有辦法將數據附加到我的問題,請告訴我,我會盡快這樣做。 ...

如何在R的dplyr pipe的變異中使用hashmap的查詢function?

[英]How to use query function of hashmap in mutate of dplyr pipe in R?

我想使用 hashmap 找到一個值,然后使用該值計算一個新值。 平時我盡量高效工作,但我對R不是很精通。我知道dplyr管道的基礎,所以不想再使用for循環了。 這是這種情況的最小可重現示例: 不幸的是,我收到此錯誤: 請注意,這是有效的: score1=query(testmap, m.sub ...


 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM