使用雙循環創建DataFrame

Question

我懂了：

columns = ['a','b','c']
data = [1,2,3],[3,4],[4,5,5]
df = pandas.DataFrame({i:pandas.Series(j) for i in columns for j in data})
print(df)

輸出：

我需要：

我真的不明白為什么這不起作用。 我知道我正在以正確的方式訪問data中的元素。

有小費嗎？

Answer 1

應該這樣做：

import pandas as pd

data = [[1, 2, 3], [3, 4], [4, 5, 5]]
df = pd.DataFrame(data).transpose()
df.columns = columns

輸出：

    a    b    c
0  1.0  3.0  4.0
1  2.0  4.0  5.0
2  3.0  NaN  5.0

Answer 2

當您進入第二個循環時，您正在覆蓋值。 您正在做的是：

import pandas


columns = ['a','b','c']
data = [1,2,3],[3,4],[4,5,5]

myDict = {}
for i in columns:
    for j in data:
        myDict[i]=j
print(pandas.DataFrame(myDict))

這就是為什么您的數據被覆蓋的原因。 您要做的顯然是：

myDict = {}
for i,key in enumerate(columns):
    myDict[key] = data[i]

但是，這將導致：

raise ValueError('arrays must all be same length')
ValueError: arrays must all be same length

在這里有一個很好的解決方案

使用雙循環創建DataFrame

問題描述

2 個解決方案

解決方案1
2 已采納 2018-09-23 12:36:39

解決方案2
1 2018-09-23 13:57:02

使用雙循環創建DataFrame

問題描述

2 個解決方案

解決方案1 2 已采納 2018-09-23 12:36:39

解決方案2 1 2018-09-23 13:57:02

解決方案1
2 已采納 2018-09-23 12:36:39

解決方案2
1 2018-09-23 13:57:02