如何通过某些标准过滤 dataframe 然后保存。csv？

Question

大家好，我几天前开始使用 jupyter notebook。

我需要帮助，我有一个熊猫的 dataframe。 像这样的东西

Date    Stock   Company   Volume

01/02    APPL3   Apple     1.000.000

01/02    YUSS    Yusduqs     200.000

01/02    APPL4    Apple      200.000

01/02    DISN    Disney      1.500.000

02/02    APPL3    Apple       100.000

02/02    YUSS    Yusduqs     1.250.000

02/02    DISN     Disney     2.000.000

02/02    APPL4    Apple     1.250.000

 ...            ...           ....

我需要 select 股票在 80% 以上的日子里交易量超过每天 500.000,00 美元。

我需要 select **每家公司只有一只股票，标准是在所有日子里总成交量更多。 就像 [Company] 中的“Apple”，我有两个不同的 [Stock] Appl3 和 Appl4，在这种特定情况下，我只需要 APPL4。

（因为 Appl4 中合并的天数 > Appl3 中合并的天数）

我是这样开始的：

unique_dates=len(df['Date'].value_counts()) share_freq=df[df['Volume']>=500000]]['Stock'].value_counts() stocks=share_freq/unique_dates for stock,value in stocks.items(): if(value>0.8): print(stock)

所以在那之后我可以看到哪个> 0.8但我仍然需要select每个公司只有一只股票。 我不知道如何尊重所有的标准和最终过滤所有 dataframe 的标准并保存在.csv

Answer 1

我们可以使用nunique

n=df.loc[df['Volume']>=500000,'Date'].groupby(df['Stock']).nunique()
uniquedate=df.Date.nunique()
n=n[n/uniquedate >0.8]
print(n.index)

更新

df.loc[df.Stock.isin(n.index)].to_excel('output.xlsx')

如何通过某些标准过滤 dataframe 然后保存。csv？

问题描述

1 个解决方案

解决方案1
0 已采纳 2020-05-27 00:36:30

如何通过某些标准过滤 dataframe 然后保存。csv？

问题描述

1 个解决方案

解决方案1 0 已采纳 2020-05-27 00:36:30

解决方案1
0 已采纳 2020-05-27 00:36:30