[英]pd.DataFrame on dataframe
pd.DataFrame 对 dataframe 有什么作用? 请看下面的代码。
In [1]: import pandas as pd
In [2]: a = pd.DataFrame(dict(a=[1,2,3], b=[4,5,6]))
In [3]: b = pd.DataFrame(a)
In [4]: a['c'] = [7,8,9]
In [5]: a
Out[5]:
a b c
0 1 4 7
1 2 5 8
2 3 6 9
In [6]: b
Out[6]:
a b c
0 1 4 7
1 2 5 8
2 3 6 9
In [7]: a.drop(columns='c', inplace=True)
In [8]: a
Out[8]:
a b
0 1 4
1 2 5
2 3 6
In [9]: b
Out[9]:
a b c
0 1 4 7
1 2 5 8
2 3 6 9
在In[3]
中,function pd.DataFrame
应用于 dataframe a
。 原来a
和b
的id不一样。 但是,当将一列添加到a
时,同一列将添加到b
,但是当我们从a
中删除一列时,该列不会从b
中删除。 那么pd.DataFrame
有什么作用呢? a
和b
是相同的 object 还是不同的? 我们应该对a
做什么,以便我们从b
中删除列? 或者,当我们将列添加到a
时,我们如何防止列被添加到b
?
我会不惜一切代价避免你的陈述。 最好这样制作 dataframe :
df=pd.DataFrame({'a': [0,1,2], 'b': [3,4,5], 'c':[6,7,8]})
上面的结果是一个 dataframe,带有索引和列名。
您可以向 df 添加一列,如下所示:
df['d'] = [8,9,10]
并删除一列到 dataframe,如下所示:
df.drop(columns='c',inplace=True)
我不会从 function 定义创建 dataframe,而是使用“附加”。 Append 适用于字典和数据帧。 基于字典的 append 示例:
df = pd.DataFrame(columns=['Col1','Col2','Col3','Col4']) # create empty df with column names.
append_dict = {'Col1':value_1, 'Col2':value_2, 'Col3':value_3,'Col4':value_4}
df = df.append(append_dict,ignore_index=True).
这些值可以在循环中更改,因此它对先前的值做了一些事情。 For dataframe append, you can check the pandas documentation (just replace the append_dict argument with the dataframe that you like to append)
这是你想要的吗?
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.