[英]Pandas DataFrame column concatenation
我有一個pandas Dataframe y,有100萬行和5列。
np.shape(y)
(1037889, 5)
列值都是0或1.看起來像這樣:
y.head()
a, b, c, d, e
0, 0, 1, 0, 0
1, 0, 0, 1, 1
0, 1, 1, 1, 1
0, 0, 0, 0, 0
我想要一個包含100萬行和1列的Dataframe。
np.shape(y)
(1037889, )
列只是連接在一起的5列。
New column
0, 0, 1, 0, 0
1, 0, 0, 1, 1
0, 1, 1, 1, 1
0, 0, 0, 0, 0
我一直在嘗試不同的東西,比如merge
, concat
, dstack
等......但似乎dstack
這個問題。
如果您希望新列將所有數據連接到字符串,那么apply()函數就是好的情況:
>>> df = pd.DataFrame({'a':[0,1,0,0], 'b':[0,0,1,0], 'c':[1,0,1,0], 'd':[0,1,1,0], 'c':[0,1,1,0]})
>>> df
a b c d
0 0 0 0 0
1 1 0 1 1
2 0 1 1 1
3 0 0 0 0
>>> df2 = df.apply(lambda row: ','.join(map(str, row)), axis=1)
>>> df2
0 0,0,0,0
1 1,0,1,1
2 0,1,1,1
3 0,0,0,0
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.