[英]Filtering dataframe based on other dataframe column on Python
我有兩個數據框。 一個包含多個帶有樣本名稱的列和包含值的行。 第二個 DataFrame 包含一個名為“樣品名稱”的列,其中包含通過質量控制的樣品名稱列表。 df1
| mz | Sample 001| Sample 002...
|:---- |:---------:| ---------:|
| 234 | 3434 | 34545 |
|:---- |:---------:| ---------:|
| 4542 | 5656563 | 4545 |
df2
| Sample Name | RT |
| ----------- | ---|
| Sample001 | 8 |
| Sample002 | 8 |...
df1 包含 2000 多行和 200 列,df2 包含 180 列。 我想過濾 df1 以刪除 df2 列“Sample Name”中不存在的列結果 DataFrame 應該是 df1 的一個版本,其中包含 df2 列表中的 180 列。
如果這有效:
for col in df1.columns:
if col not in df2['Sample Name'].unique():
df1.drop(columns=[col], inplace=True)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.