繁体   English   中英

计算 Pandas Dataframe 中两个不同列的新行

[英]Calculating new rows in a Pandas Dataframe on two different columns

所以我是 Python 的初学者,我有一个包含 Country、avgTemp 和 year 的数据框。 我想要做的是计算每个国家的新行,其中年份增加 20,avgTemp 乘以名为 tempChange 的变量。 我不想删除以前的值,我只想附加新值。

这是数据框的外观: 在此处输入图片说明

最好我还想创建一个循环来运行代码一定次数超级感谢任何帮助!

如果您需要从数据框中复制值作为示例,您可以在此处获取它:

Country        avgTemp        year

0 Afghanistan    14.481583    2012

1 Africa         24.725917    2012

2 Albania        13.768250    2012

3 Algeria        23.954833    2012

4 American Samoa 27.201417    2012

243 行 × 3 列

如果你想重复行,我会创建一个新的数据帧,在新的数据帧中执行任何操作(总和 20 年,将温度乘以一个常数或数组等......)然后使用concat()将其附加到原始数据帧:

import pandas as pd
tempChange=1.15
data = {'Country':['Afghanistan','Africa','Albania','Algeria','American Samoa'],'avgTemp':[14,24,13,23,27],'Year':[2012,2012,2012,2012,2012]}
df = pd.DataFrame(data)
df_2 = df.copy()
df_2['avgTemp'] = df['avgTemp']*tempChange
df_2['Year'] = df['Year']+20
df = pd.concat([df,df_2]) #ignore_index=True if you wish to not repeat the index value
print(df)

输出:

          Country  avgTemp  Year
0     Afghanistan    14.00  2012
1          Africa    24.00  2012
2         Albania    13.00  2012
3         Algeria    23.00  2012
4  American Samoa    27.00  2012
0     Afghanistan    16.10  2032
1          Africa    27.60  2032
2         Albania    14.95  2032
3         Algeria    26.45  2032
4  American Samoa    31.05  2032

其中 df 是您的数据框名称:

 df['tempChange'] = df['year']+ 20  * df['avgTemp']

这将使用上述逻辑向您的 df 添加一个新列。 我不确定我是否理解你的逻辑正确,所以数学可能需要一些工作

我相信你正在寻找的是

dfName['newYear'] =  dfName.apply(lambda x: x['year'] + 20,axis=1)
dfName['tempDiff'] =  dfName.apply(lambda x: x['avgTemp']*tempChange,axis=1)

这就是您应用于每一行的方式。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM