簡體   English   中英

如何向現有 dataframe 添加新列並用另一列的部分數據填充它?

[英]How do I add a new column to an existing dataframe and fill it with partial data from another column?

我有一個 dataframe作業dataframe 的屏幕截圖

我需要在工作數據框中添加一個新列“年份”。 此列應包含每個 post_date 的相應年份(這已經是一列)。 例如:對於 post_date 值 2017-08-16 'year' 值應該是 2017。

我不確定如何在插入新列的同時從預先存在的列中提取數據。

使用dt.year

jobs['year'] = pd.to_datetime(jobs['post_date'], errors='coerce').dt.year

我將首先將列 post_date 轉換為日期格式。 完成此操作后,您可以使用簡單的 function 來提取年份。

jobs["post_date"] =pd.to_datetime(jobs["post_date"])

應該足以將其更改為日期時間類型。 如果不是,您應該使用 datetime strpstring 來告訴 python “post_date”列的具體格式是什么,以便將其讀取為日期。 之后執行以下操作:

jobs["year"] =jobs["post_date"].dt.year

如果我正確理解您的問題,您想從當前 dataframe 的列中向現有 dataframe 添加新的年份值列。 要僅提取年份值,您需要先進行一些計算。 您可以使用 pandas datetime.datetime 並僅提取 Post_date 列中的年份值。 看看這個這個 要存儲這些年份值,您可以簡單地執行以下操作:

jobs['year'] = jobs['post_date'].dt.year

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM