繁体   English   中英

如何向现有 dataframe 添加新列并用另一列的部分数据填充它?

[英]How do I add a new column to an existing dataframe and fill it with partial data from another column?

我有一个 dataframe作业dataframe 的屏幕截图

我需要在工作数据框中添加一个新列“年份”。 此列应包含每个 post_date 的相应年份(这已经是一列)。 例如:对于 post_date 值 2017-08-16 'year' 值应该是 2017。

我不确定如何在插入新列的同时从预先存在的列中提取数据。

使用dt.year

jobs['year'] = pd.to_datetime(jobs['post_date'], errors='coerce').dt.year

我将首先将列 post_date 转换为日期格式。 完成此操作后,您可以使用简单的 function 来提取年份。

jobs["post_date"] =pd.to_datetime(jobs["post_date"])

应该足以将其更改为日期时间类型。 如果不是,您应该使用 datetime strpstring 来告诉 python “post_date”列的具体格式是什么,以便将其读取为日期。 之后执行以下操作:

jobs["year"] =jobs["post_date"].dt.year

如果我正确理解您的问题,您想从当前 dataframe 的列中向现有 dataframe 添加新的年份值列。 要仅提取年份值,您需要先进行一些计算。 您可以使用 pandas datetime.datetime 并仅提取 Post_date 列中的年份值。 看看这个这个 要存储这些年份值,您可以简单地执行以下操作:

jobs['year'] = jobs['post_date'].dt.year

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM