使用 group by 將更改應用於整個 dataframe

Question

我正在嘗試對 dataframe 應用更改，以獲取僅通過使用 groupby 返回的值（據我所知）。 所以我想要找到每個公司的最小日期值，以便我可以將數字 0 應用於多個列中的第一個值（在本例中為 df2['Research and Development Expense Lag'] 和 df2['Capital Expenditures Lag' ]）。 這是我到目前為止所擁有的，一個返回每個公司的最小日期值的 groupby：

df2.groupby('Ticker Symbol').apply(lambda d: \
            d[d['Data Date'] == d['Data Date'].min()])

Answer 1

你在正確的軌道上。 您可以獲取這些行的索引值，然后將它們與.loc[]一起使用來更改這兩列中的值：

df2.loc[df2.groupby('Ticker Symbol').apply(
        lambda d: d[d['Data Date'] == d['Data Date'].min()]
    )
    .index
    .get_level_values(1),
    ['Research and Development Expense Lag', 'Capital Expenditures Lag']
] = 0

.get_level_values(1) function 用於提取 MultiIndex 的第二級。 第一級將包含Ticker Symbol值。

使用 group by 將更改應用於整個 dataframe

問題描述

1 個解決方案

解決方案1
0 已采納 2021-05-17 00:03:09

使用 group by 將更改應用於整個 dataframe

問題描述

1 個解決方案

解決方案1 0 已采納 2021-05-17 00:03:09

解決方案1
0 已采納 2021-05-17 00:03:09