[英]How to extract date from filename in python?
我需要提取寫在文件名上的事件日期到一個名為 event_date 的新列中,我假設我可以使用正則表達式,但我仍然沒有得到要實現的確切公式。
文件名寫在下面
file_name = X-Y Cable Installment Monitoring (10-7-20).xlsx
(10-7-20) 采用 mm-dd-yy 格式。
我預計日期會導致 df['event_date'] = 2020-10-07
我應該如何編寫腳本以從文件名中獲取正確的日期。
提前致謝。
將str.rsplit()
與datetime module
一起使用 -
腳步 -
from datetime import datetime
file_name = 'X-Y Cable Installment Monitoring (10-7-20).xlsx'
date = file_name.rsplit('(')[1].rsplit(')')[0] # '10-7-20'
date = datetime.strptime(date, "%m-%d-%y").strftime('%Y-%m-%d') # '2020-10-07'
或通過regex
-
import re
regex = re.compile(r"(\d{1,2}-\d{1,2}-\d{2})") # pattern to capture date
matchArray = regex.findall(file_name)
date = matchArray[0]
date = datetime.strptime(date, "%m-%d-%y").strftime('%Y-%m-%d')
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.