[英]Building a pandas data frame with a given index from two series
假設我有兩個系列:
foo = pd.Series([1,2,3])
bar = pd.Series([7,6,5])
我要從中構建數據框架:
tmp = pd.DataFrame()
tmp['foo'] = foo
tmp['bar'] = bar
接下來,我設置新數據幀的索引:
tmp.index=range(1,4)
最終, tmp
以這種方式是:
foo bar
1 1 7
2 2 6
3 3 5
但是,以下快捷方式:
pd.DataFrame(
{
"foo": foo,
"bar": bar
},
index=range(1,4)
)
產生以下內容:
bar foo
1 6.0000 2.0000
2 5.0000 3.0000
3 nan nan
索引正確,但值不正確。 為什么不一樣? 如果在創建序列時設置foo
和bar
的索引,則第二種方法有效。
您可以選擇:
pd.DataFrame(
{
"foo": foo.values,
"bar": bar.values
},
index=range(1,4)
)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.