pd.DataFrame 上 dataframe

Question

pd.DataFrame 对 dataframe 有什么作用？ 请看下面的代码。

In [1]: import pandas as pd                                                                                                                           

In [2]: a = pd.DataFrame(dict(a=[1,2,3], b=[4,5,6]))                                                                                                  

In [3]: b = pd.DataFrame(a)                                                                                                                           

In [4]: a['c'] = [7,8,9]                                                                                                                              

In [5]: a                                                                                                                                             
Out[5]: 
   a  b  c
0  1  4  7
1  2  5  8
2  3  6  9

In [6]: b                                                                                                                                             
Out[6]: 
   a  b  c
0  1  4  7
1  2  5  8
2  3  6  9

In [7]: a.drop(columns='c', inplace=True)                                                                                                             

In [8]: a                                                                                                                                             
Out[8]: 
   a  b
0  1  4
1  2  5
2  3  6

In [9]: b                                                                                                                                             
Out[9]: 
   a  b  c
0  1  4  7
1  2  5  8
2  3  6  9

在In[3]中，function pd.DataFrame应用于 dataframe a 。 原来a和b的id不一样。 但是，当将一列添加到a时，同一列将添加到b ，但是当我们从a中删除一列时，该列不会从b中删除。 那么pd.DataFrame有什么作用呢？ a和b是相同的 object 还是不同的？ 我们应该对a做什么，以便我们从b中删除列？ 或者，当我们将列添加到a时，我们如何防止列被添加到b ？

Answer 1

我会不惜一切代价避免你的陈述。 最好这样制作 dataframe ：

df=pd.DataFrame({'a': [0,1,2], 'b': [3,4,5], 'c':[6,7,8]})

上面的结果是一个 dataframe，带有索引和列名。

您可以向 df 添加一列，如下所示：

df['d'] = [8,9,10]

并删除一列到 dataframe，如下所示：

df.drop(columns='c',inplace=True)

Answer 2

我不会从 function 定义创建 dataframe，而是使用“附加”。 Append 适用于字典和数据帧。 基于字典的 append 示例：

df = pd.DataFrame(columns=['Col1','Col2','Col3','Col4']) #  create empty df with column names. 
append_dict = {'Col1':value_1, 'Col2':value_2, 'Col3':value_3,'Col4':value_4}
df = df.append(append_dict,ignore_index=True).

这些值可以在循环中更改，因此它对先前的值做了一些事情。 For dataframe append, you can check the pandas documentation (just replace the append_dict argument with the dataframe that you like to append)

这是你想要的吗？

pd.DataFrame 上 dataframe

问题描述

2 个解决方案

解决方案1
0 2020-04-09 13:10:40

解决方案2
0 2020-04-13 08:01:22

pd.DataFrame 上 dataframe

问题描述

2 个解决方案

解决方案1 0 2020-04-09 13:10:40

解决方案2 0 2020-04-13 08:01:22

解决方案1
0 2020-04-09 13:10:40

解决方案2
0 2020-04-13 08:01:22