[英]Nested Python dictionary to Pandas dataframes
我有一個嵌套的 Python 字典:
d={'CON-2': {'gene-ODF3': [2.0, 44474],'gene-SCGB1C1': [0.184937, 36615], 'gene-TRNAN-GUU-19': [32.0, 443]},'CON-1':{'gene-ODF3': [10.00, 44474], 'gene-SCGB1C1': [0.184937, 36615], 'gene-TRNAN-GUU-19': [30.0, 443], 'gene-LOC103247846': [20.0, 22111]}}
我想 plot 將每個基因的 FPKM(第一個值)與其 DNA 轉錄本豐度(第二個值)放在散點圖上。 我嘗試了一些不同的方法,例如:
CON_1=pd.DataFrame(d['CON-1'].items(),columns=['FPKM','Fraction-0'])
CON_2=pd.DataFrame(d['CON-2'].items(),columns=['FPKM','Fraction-0'])
df=pd.DataFrame.from_dict({(i,j): d[i][j]
for i in d.keys()
for j in d[i].keys()},
orient='index')
但我無法將這兩個值彼此分開。 我想為每個條件(CON-1 和 CON-2)生成一個單獨的數據框,如下所示:
gene FPKM DNA-abundance
gene-ODF3 2.0 44474
pd.DataFrame(d)['CON-1'].apply(pd.Series)\
.rename(columns={0:'FPKM',1:'DNA-abundance'})
# FPKM DNA-abundance
#gene-ODF3 10.000000 44474.0
#gene-SCGB1C1 0.184937 36615.0
#gene-TRNAN-GUU-19 30.000000 443.0
#gene-LOC103247846 20.000000 22111.0
其他情況也一樣。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.