![](/img/trans.png)
[英]Create a new column based on vectors pre-determined using case_when
我有一個名為“ sim ”的大數據框,它有一個名為“ CAUSABAS ”的字符列,如下所示: 此 data.frame 是使用 package microdatasus創建的,如下所示: 我想創建以下列: grupo_causa_basica ,對這些CAUSABAS進行分類。 一些觀察有 3 個 ...
[英]Create a new column based on vectors pre-determined using case_when
我有一個名為“ sim ”的大數據框,它有一個名為“ CAUSABAS ”的字符列,如下所示: 此 data.frame 是使用 package microdatasus創建的,如下所示: 我想創建以下列: grupo_causa_basica ,對這些CAUSABAS進行分類。 一些觀察有 3 個 ...
[英]Mutate column for n% of the total dataframe, in descending order of other column r
我有一個DF 我想使用以下方法將 dataframe 的 25% 的 var2 修改為“0.3”: 但是,我希望按var3的降序選擇 25% 的數據,這樣 output 就是: 其中行 IDS 6 和 7 已被修改,因為它們具有 Var3 的最高值和第二高值。 它應該起作用,以便我可以改變突變的百分 ...
[英]Rowsums on two vectors of paired columns but conditional on specific values
我有一個數據集,看起來像下面的數據集,其中有與類型(datA、datB、datC)相關的三“對”列,以及每種類型的總數(datA_total、datB_total、datC_total): 我正在嘗試在每一行中創建一個 rowSums,以確定每種數據類型的總訪問量,條件是它們是否滿足任何分數范圍 ( ...
[英]Add a column at specific position using mutate in r
我想在 r 中的特定 position 添加一列,但是 mutate (xx, .before = "exisiting column) 不能正常工作: 它創建一個“.before”列,而不是在第一列之前添加新列。 我嘗試了 add_column(),它工作正常。 但是我還是想知道為什么會出錯。 ...
[英]Select column based on indicator in another column
我在 R 中有一個 dataframe,其中有一列帶有數字指示符,我想根據該指示符從 dataframe 中的其他列中創建一個新列。 如果我通過一個例子來解釋可能是最簡單的...... 我想根據指標中的數字從 columnx 列中選擇一個新列,即結束 我試圖避免用很長的 ifelse 來做這件事,因 ...
[英]dplyr mutate and purrr map: use data masking to select columns for map
在 dplyr 突變上下文中,我想通過 purrr:map 使用另一列的值將 function 應用於 select 列。 讓我們來一個測試數據框test <- data.frame(a = c(1,2), b = c(3,4), selector = c("a","b")) 我要申請以下f ...
[英]dplyr mutate sequence by n levels of grouping by variable
所以,我的數據如下所示: 時期日期 1個 01-01-2020 1個 02-01-2020 1個 03-01-2020 2個 04-01-2020 2個 05-01-2020 2個 06-01-2020 3個 07-01-2020 3個 08-01-2020 3個 09-01-202 ...
[英]Mutate results with multiple variables using for loop
我有這個 dataframe 如您所見,對於每個板中的每個標記,我有不同的 LOD 值。 所以我計算每個標記的平均 LOD 使用 這導致所有板的每個標記的以下平均 LOD 到目前為止,一切都很好。 現在我想檢查我的標記結果是高於還是低於我的平均 LOD。 如果高於我的平均 LOD,則不得更改結果,如 ...
[英]Row bind multiple columns into two columns averaging unique elements in order
我仍在學習 R 並且想知道我是否有一種優雅的方式來操縱下面的 df 來實現 df2。 我不確定它是否應該用於此循環,但基本上我想對每個 V(X)_ID 取一個不同的值並對其關聯的 V(X)_No 列進行平均。 非常感謝您的幫助,因為我有數百種此類格式的列,並且從手動的角度來看它是非常耗費精力的。 謝 ...
[英]In R, how do I make a long dataset that contains all the categories that a row applies to?
我有一個學生數據集,我想創建一個列,根據每個學生和其他學生在“主題”和“成績字母”列中的數據對每個學生進行分類,因為我最終想創建一個列,上面寫着“math_science_A”, “science_B”等,以了解有多少學生根據獨特的構成獲得了 A、B、C 等。 我有一個學生可以擁有的所有潛在組合的 ...
[英]In R, how can I get the sum for all combinations of two variables?
我有一個包含學生成績和科目的長數據集。 我想保留一個長數據集,但我想添加一個列,告訴我一個學生在他們的人文課程(英語和歷史)和他們的 STEM 課程(生物學和數學)中有多少 F。 我也希望 Ds、Cs、Bs 和 As 也一樣。 我知道我可以明確地說明這一點,但在未來,他們可能會有其他科目(比如將化 ...
[英]How to identify rows where observations are identical in two different columns in R?
我有兩列,我們稱它們為 start_id 和 end_id,每列都有字符串觀察值。 它們的結構必須保持為 chr。 這是在具有數百萬行的數據集中。 我想創建一個新列來評估 start_id = end_id。 如果它們相等,我希望它評估為 TRUE,如果不相等,則為 FALSE。 我希望新列是永久 ...
[英]Add a column to dataframes in a list based on the existence of other columns in R
我正在嘗試根據這些數據框中列的存在,向我擁有的列表(包含約 200 個數據框的長列表)中的所有數據框添加一個新列。 以 iris 數據集的修改和未修改版本為例,我試圖為每個 dataframe 提供一個名為“species_fixed”的新列。 我要遵循的規則是: 如果“Species”列存在於 d ...
[英]Got stuck while changing data format from wide to long
我是 R 的完全初學者。幾天前我安裝了 R 以完成我的課程作業。 其中一項說明是我必須將數據格式從寬格式更改為長格式。 該數據是 1972 年至 2021 年孟加拉國匯款流入的時間序列數據。 我在行中列出了年份,在列中列出了來自不同國家/地區的匯款金額。 我編寫了以下代碼將數據格式更改為長格式: 這 ...
[英]How to mutate two var with values 0, 1 & NA into a var with the sum of 0 and 1?
我遇到了一個問題,我想將兩個值為 0、1 和 NA 的變量突變為一個總和為 0 和 1 的新變量,但是,在我的例子中,R 將 NA 計為 0 或僅返回 NA。 有沒有一個簡單的解決辦法,排除 NA? 這些變量是大型數據集的一部分。 在這個數據集中,我有一些調查實驗,這兩個變量是其中的一部分,這意味 ...
[英]Row bind multiple columns into two columns containing unique elements in order
我對 R 還是不太熟悉,想知道是否有一種簡單的方法可以操縱下面的 df 來實現 df2。 我不確定它是否應該用於此循環,但基本上我想在每個 V(X)_ID 列和它對應的 V(X)_No 列上采用不同的方式。 如果 V(X)_ID 在其他列中重復,我想忽略它並移動下一個唯一的 V(X)_ID 及其關聯 ...
[英]R - mutate getting the first smaller value from the top rows
所以,問題是,我試圖在轉換后的變量的頂行中獲取第一個較小的值。 我的 df 看起來像: 數數 24 33 33 34 35 33 34 35 ... 它只包含一列。 我要找的output: 數數關閉上一個 24 北美 33 24 33 24 34 33 35 34 3 ...
[英]How do I replace all values in multiple columns in a dataframe with values from a different dataframe based on multiple conditions?
我想用 df_ref 中的相應值替換 df_skeleton 列中的所有值,不包括Date Time和ID列。 df_skeleton 中的值應根據以下條件替換為 df_ref 中的值: df_ref 列名包含 df_skeleton 列名 df_ref 列名稱包含在 df_skeleton ...
[英]Create binary variable based on length of group in another column
我需要根據名為“cluster”的變量的長度創建一個名為 flow.type 的二進制變量。 如果簇的長度為 1,則 flow.type 應為“0”,如果 >1,則 flow.type 應為“1”。 我已經在圖像中放置了我的數據示例,但如果有辦法將數據附加到我的問題,請告訴我,我會盡快這樣做。 ...
[英]How to use query function of hashmap in mutate of dplyr pipe in R?
我想使用 hashmap 找到一個值,然后使用該值計算一個新值。 平時我盡量高效工作,但我對R不是很精通。我知道dplyr管道的基礎,所以不想再使用for循環了。 這是這種情況的最小可重現示例: 不幸的是,我收到此錯誤: 請注意,這是有效的: score1=query(testmap, m.sub ...