[英]Convert column to row in Python Pandas
我有以下 Python 熊貓數據框:
fruits | numFruits
---------------------
0 | apples | 10
1 | grapes | 20
2 | figs | 15
我想要:
apples | grapes | figs
-----------------------------------------
Market 1 Order | 10 | 20 | 15
我看過pivot()、pivot_table()、Transpose和unstack(),但似乎沒有一個給我這個。 熊貓新手,所以感謝所有幫助。
print (df.set_index('fruits').T)
fruits apples grapes figs
numFruits 10 20 15
如果需要重命名列,有點復雜:
print (df.rename(columns={'numFruits':'Market 1 Order'})
.set_index('fruits')
.rename_axis(None).T)
apples grapes figs
Market 1 Order 10 20 15
另一個更快的解決方案是使用numpy.ndarray.reshape
:
print (pd.DataFrame(df.numFruits.values.reshape(1,-1),
index=['Market 1 Order'],
columns=df.fruits.values))
apples grapes figs
Market 1 Order 10 20 15
時間:
#[30000 rows x 2 columns]
df = pd.concat([df]*10000).reset_index(drop=True)
print (df)
In [55]: %timeit (pd.DataFrame([df.numFruits.values], ['Market 1 Order'], df.fruits.values))
1 loop, best of 3: 2.4 s per loop
In [56]: %timeit (pd.DataFrame(df.numFruits.values.reshape(1,-1), index=['Market 1 Order'], columns=df.fruits.values))
The slowest run took 5.64 times longer than the fastest. This could mean that an intermediate result is being cached.
1000 loops, best of 3: 424 µs per loop
In [57]: %timeit (df.rename(columns={'numFruits':'Market 1 Order'}).set_index('fruits').rename_axis(None).T)
100 loops, best of 3: 1.94 ms per loop
pd.DataFrame([df.numFruits.values], ['Market 1 Order'], df.fruits.values)
apples grapes figs
Market 1 Order 10 20 15
參考 jezrael 對這個概念的增強。 df.numFruits.values.reshape(1, -1)
效率更高。
您可以使用熊貓的轉置 api 如下:
df.transpose()
將 df 視為您的熊貓數據框
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.