簡體   English   中英

從 dataframe 列中提取格式日期

[英]Extract format dates from dataframe column

我在 python 中有一個 dataframe 包含各種日期。

df = pd.DataFrame({"Date":["2020-01-27 welcome ! offer","Space ! offer 2020-02-27","new | 2020-03-27"],
                   "A_item":[2, 8, 0],
                   "B_item":[1, 7, 10],
                   "C_item":[9, 2, 9],

                   })

結果我需要得到這個

日期 A_項目 B_item C_item 提取日期
2020-01-27 歡迎光臨! 提供 2個 1個 9 27-01-2020
空間 ! 報價 2020-02-27 8個 7 2個 27-02-2020
空間 ! 報價新品 2020-03-27 0 10 9 27-03-2020

有誰知道如何提取它們

您可以嘗試以下代碼:

def extract_date(x):
    pattern = "[0-9]+-[0-9]+-[0-9]+"
    match = re.findall(pattern, x)
    return match[0]

df["new_column"] = df["first_colum"].apply(extract_date)

first_column是源列。

然后你應該得到下面的 output:

在此處輸入圖像描述

df['Extracted Date']=df['Date'].str.extract(r'([\d]{2}-[\d]{2}-[\d]{4})|\)')

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM