簡體   English   中英

當某些行與另一數據框匹配時,創建一個新數據框,該數據框具有一個數據框的兩列

[英]Creat a new dataframe that has two columns of one dataframe when some rows matches with another dataframe

我有兩個大數據框。 “基因”具有這樣的結構(盡管超過三列):

Mutation ID   CDS         Mutation AA
COSM1000525   123         V617A 
COSM1003371   234         S517A
COSM1003372   456         T417A
COSM1004880   567         K317A
COSM1004881   1234        R610A
COSM1004883   1234        V617A
COSM1004884   543         W617A
COSM1006396   132         Y617A
COSM1007340   7654        V617A

“輸出”是“基因”的一部分,只有一列Mutation ID

Mutation ID             
COSM1000525   
COSM1003372                   
COSM1004881   

當突變ID與“輸出”中的那些匹配時,我想創建一個新的數據框,該數據框具有“基因”的兩列(“ Mutation ID和“ Mutation AA ”)。

如何在python中實現呢?

熊貓索引和選擇數據是一個很好的指南。

mut_filter = set(output['Mutation ID'])
df = gene.loc[gene['Mutation'].isin(mut_filter), ['Mutation ID', 'Mutation AA']]

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM