
[英]How to subtract control group values from multiple treatmeant groups' values in R data frame?
我在 R 中有以下數據框: 團體價值控制 2個控制 3個治療1 7 治療1 4個治療2 5個治療2 6個如何得到: 團體價值處理 1 - 對照 5個處理 1 - 對照 1個處理 2 - 對照 3個處理 2 - 對照 0 我正在考慮循環使用子集 function: ...但這看起來很糟糕( ...
[英]How to subtract control group values from multiple treatmeant groups' values in R data frame?
我在 R 中有以下數據框: 團體價值控制 2個控制 3個治療1 7 治療1 4個治療2 5個治療2 6個如何得到: 團體價值處理 1 - 對照 5個處理 1 - 對照 1個處理 2 - 對照 3個處理 2 - 對照 0 我正在考慮循環使用子集 function: ...但這看起來很糟糕( ...
[英]How to slice a dataframe by column value in R
我想創建一個 function,它允許用戶將 dataframe 用他們的輸入值按列切片。 我在想做這樣的事情 問題是返回的df_small是空的,因為提供的列col是文本值,而subset中的參數需要類似的值但沒有引號'' 。 例如, slice_df(mydata, 'month', c('Ja ...
[英]Why indexing .SD with a number is faster than when the number is stored in a variable
我有一個 data.table,我想按組(客戶 ID)匯總並查看他們的第一次支出與第二次支出、第三次支出等相比如何。 Select 例如第一行使用.SD[1] : 給出了一個非常快的結果(對於具有 500 萬行以上的數據集,只需 1.94 秒)。 但是,如果我將索引號(此處為 1)放入一個變量(我 ...
[英]How to stack rasters from a folder based on part of their name
我有一個文件夾,其中包含數百個不同名稱的柵格。 有些名稱部分相似,除了表示年份的最后 5 個字母。 例如我有 我需要堆疊共享名稱第一部分的柵格,所以(raster_a_2010 和 raster_a_1990)但我需要自動完成,而不是一個一個地指示模式。 到目前為止,我這樣做了,但我離解決方案還很遠 ...
[英]Joining three large tables by multiple columns in R
我有三個大致遵循類似格式的表格: 我想減少它們,以便三個文件中的每一個都只有在所有三個文件中都相同的變體。 這將是那些共享相同 CHR_POS、Allele1 和 Allele2 的基因。 我不打算合並這些,我仍然想要三個表作為 output 但只是這三列的子集,以便它們相同。 非常感謝 ...
[英]How to subset dataframes based on date range in another dataframe that has multiple matching ID's in R
我查看了一些解決方案,但未能找到任何包含 ID 多次出現的觀察結果的內容。 我的數據在數據框 1 (df1) 中看起來像這樣 dataframe 2 (df2) 的數據如下所示 我想通過 df2 對 df1 進行子集化,並將收集日期與 df2 中的收集日期相差 +/- 7 天的所有觀察結果保留在 ...
[英]How to replace all 0 values to NA but only in a part of data frame?
我想將所有 0 值替換為 NA 但僅在列的子集中。 要將整個 df 中的所有 0 更改為 NA,應該使用 但我只想在列 5:100 的子集中將 0 更改為 NA,我已經嘗試過 但所有這些都會返回一個錯誤。 如何將操作應用於 df 的一部分? ...
[英]Creating a dataframe in R that is a subset of a number of other columns
我有一個包含 854 個觀測值和 47 個變量的數據框 (India_Summary)。 我想創建另一個數據框,其中僅包含 47 個變量中的一些列,名為“MEMSEXCOV1”、“PostSecAvailable”、“TertiaryYears”。 我以為我可以簡單地使用它(假設我只是將新的 df ...
[英]Drop rows of data if two conditions don't exist in a column in R
我有 52K 行 dataframe。我想在組列中刪除所有不具有 Light 和 Healthy 的基因。 我想過濾掉這些。 我不太確定如何快速執行此操作。 我在想 tidyverse 或 dplyr 可能會有用。 ...
[英]Highlight a single data point in a bubble plot
我正在嘗試整理我的 plot。有 3 件事讓我很頭疼(我有點新手!) 在右上象限中,我想放大紫色氣泡的文本 label,以便“Hamble”這個詞真正脫穎而出。 我有幾次嘗試使用 subset 都失敗了,但無法讓它工作。 從我的代碼來看,紅線應該是虛線,它們都顯示為實線我想更改軸標題的字體大小,但 ...
[英]Use R to subset multiple data frames based on the same condition?
我正在處理名為 dm6、mm10 和 hg38 的多個數據幀。 它們看起來像這樣: 我想制作這樣的子集,其中我將有一個子集,其中包含在 Regulation 列中具有 UpHC 的所有行: 有沒有辦法一次完成所有這些? 我試圖將我的數據框放在列表中: 然后使用 lapply,但它沒有給出預期的結果 ...
[英]R studio: how do I subset only columns that match a list?
我覺得這不是一個很難的問題,但是一個小時的谷歌搜索讓我無所適從。 說我有以下 DF A列 B列專欄C 單元格 1 單元格 2 單元格 2 單元格 3 單元格 4 單元格 4 雖然我有數百個專欄,但我只對特定列表感興趣。 假設此列表包括“A 列”和“C 列” 然后我想過濾 dataframe 所以 ...
[英]How to phrase subsetting to choose a selection from different column
我有一個大型數據框,我想根據來自不同列(一次一個)的選定變量自動對其進行子集化。 例如,數據框df中有 4 列,我想對包含“cola”中的“a”的行進行子集化,下一次在“cola”中包含“b”的行,在“cola”中包含“c”的行,包含的行'colb' 中的 'a' 等等 所以, 這會返回一個錯誤。 ...
[英]How to use dplyr::filter() to filter using list of dynamic column names
我需要遍歷大量列名會略有不同的數據框。 我需要為行 == 0 的動態列名過濾數據框。如何將過濾器 function 與動態列名列表一起使用? 縮寫示例: data <- 列名稱包含以下內容的數據框:“pfall_met”、“cfall_met”、“fall_met”、“spring_met” ...
[英]Subset entries in each group based on dates and groups stored in another dataframe
我想根據特定課程刪除 dataframe1 中日期早於 dataframe2 中日期的行。 Dataframe1 看起來像這樣: 參與者編號課程日期 1個生物110 2022-02-03 2個生物110 2022-02-01 3個化學 110 2022-03-15 Dataframe ...
[英]How do I plot a histogram of ages in a tibble with multiple observations per patient?
我有一個小標題,每次觀察一行。 這些列具有變量,例如 ID 號、DOB 和測試結果 d1 ID 出生日期結果一種 1940-01-01 15 一種 1940-01-01 17 b 1933-05-20 11 b 1933-05-20 20 我想制作患者年齡的直方圖,但我只能得到直 ...
[英]Regression with subsets in R: Is there a nice solution with a loop or similar?
我有來自數據集的子集,並且想對這些子集執行回歸。 我可以單獨編寫所有代碼,但我正在尋找一個干凈快速的解決方案,可能帶有一個循環。 我從 mtcars 制作了一個示例數據集,其中包含 3 個子集:df1、df2、df3。 如果原則上也可以應用該解決方案進行其他分析,那就太好了:vif、逐步回歸、AN ...
[英]How to use subset() in a for loop in R
我需要使用 function subset() 計算 select 數據集 Iris(在 R 中可用)中的 Species 級別,並計算來自同一數據集的列 Petal.Length 的平均值,所有內容都帶有 for 循環。 我知道我可以使用 function tappy 進行此計算,但任務在於使用 ...
[英]Error in subset.default using bulk_postcode_loo
最終我想使用英格蘭所有公立中學的郵政編碼,但現在我想弄清楚我需要使用什么代碼,所以只選擇了 5 所。 我想檢索每個郵政編碼的坐標(緯度和經度)和 lsoa 值。 pc_list <-列表(郵政編碼= c(“PE7 3BY”,“ME15 9AZ”,“BS21 6AH”,“SG18 8JB”,“ ...
[英]SQL to delete subset entries
想象一張表,其中一個條目為“我宣誓效忠美國國旗。 ”,另一個條目為“我宣誓效忠” 尋找 SQL 從同一個表中刪除較短的條目,這是較長條目的子集。 我有這個,但它不起作用: 任何幫助,將不勝感激。 ...