簡體   English   中英

從 OrderedDict 中提取數據

[英]Extract Data from OrderedDict

我想從 OrderedDict 中刪除數據。

我有以下清單:

1384   2018-11-23
1385   2018-11-23
1386   2018-11-23
1387   2018-11-23
1397   2018-11-24
1398   2018-11-24
1399   2018-11-24
1400   2018-11-24
1401   2018-11-24
1402   2018-11-24
1403   2018-11-24
1404   2018-11-24
1417   2018-11-25
1418   2018-11-25
1419   2018-11-25
1420   2018-11-25
1421   2018-11-25
1422   2018-11-25
1423   2018-11-25
1424   2018-11-25
1425   2018-11-25
1426   2018-11-25
1427   2018-11-25
1428   2018-11-25
1439   2018-11-25
1440   2018-11-26
1441   2018-11-26
1442   2018-11-26
1443   2018-11-26
1444   2018-11-26
1445   2018-11-26
1446   2018-11-26
1447   2018-11-26
1448   2018-11-26
1449   2018-11-26
1450   2018-11-26
1452   2018-11-26
1461   2018-11-26
1462   2018-11-26
1463   2018-11-26
1464   2018-11-27
1465   2018-11-27
1466   2018-11-27
1467   2018-11-27
1468   2018-11-27
1670   2018-12-05
1671   2018-12-05
1686   2018-12-06
1687   2018-12-06
1688   2018-12-06

我已經用這個代碼計算了每個日期的出現次數:

inp=df_nan[label_date]
odct = OrderedDict()
for item in inp:
    try:
        odct[item] += 1
    except KeyError:
        odct[item] = 1

它給了我輸出:

OrderedDict
([(Timestamp('2018-11-23 00:00:00'), 4),

(Timestamp('2018-11-24 00:00:00'), 8),

(Timestamp('2018-11-25 00:00:00'), 13),

(Timestamp('2018-11-26 00:00:00'), 15),

(Timestamp('2018-11-27 00:00:00'), 5),

(Timestamp('2018-12-05 00:00:00'), 2),

(Timestamp('2018-12-06 00:00:00'), 3)])

現在我只想保留等於或小於 5 的日期。

一旦完成。 我想刪除數據集中出現次數高於 5 的日期。

謝謝你的幫助。

您可以使用內置函數filter

filter(lambda x: odct[x] <= 5, df_nan)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM