簡體   English   中英

python 刪除具有相同鍵的行並保留具有最新日期戳的行

[英]python remove rows with the same keys and keep the row with the most recent date stamp

我有一張 SharePoint excel 表格,其中的文件名和格式每天都會更新最新信息。 這些行是訂單號(作為其他數據框的鍵)、訂購數量和當天收到的數量。

如果今天下的訂單更多,則會添加行,而舊訂單將在幾天后被刪除,以保持此報告的大小相對較小。 看起來像這樣

在此處輸入圖像描述

我想要做的是有一個 Python 程序或 Power BI 來生成另一個 excel 文件並自動刷新它。 此生成的文件將保留所有不同的 PO 編號(如 SQL 中的 groupby 或 excel 中的 pivot),但僅保留最近幾天的記錄。

例如,如果 2021 年 1 月 2 日和 2021 年 1 月 3 日的文件如下所示:

在此處輸入圖像描述

例如,

在此處輸入圖像描述

然后在 1/3 上生成的文件將如下所示:

在此處輸入圖像描述

只需為所有不同的 PO 保留一行,這一行將是報告中最近幾天的行。

在 python 中,您可以根據它們的字典順序比較字符串,所以如果我們查看邏輯表達式

'A' < 'B'

此比較將導致 True。 因此,您可以編寫一個 function ,它將使用此功能整理出具有相同日期的最大的一個。

此外,如果您將日期表述為"2020-02-14" / YYYY-MM-DD ,那么您還可以使用字符串比較來找出哪個日期更舊或更新,或者換句話說,更大或更小。

For writing and reading you could use python CSV librarys as I understood you are working with.csv files but in my opinion these librarys aren't actually that helpful because you can also implement the same functionallity in python quite easily, but it comes down to你更喜歡什么。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM