[英]For each unique index value in MultiIndex level 0, print index if values (strings) in another column are not unique
我正在使用如下所示的面板數據(僅包括相關列):
Ticker Year Account_number Industry
AAA 2018 xxxx Fossil
2019 xxxx Fossil
2020 xxxx Fossil
BBB 2018 yyyy Materials
2019 yyyy Services
2020 yyyy Materials
CCC 2018 zzzz Services
2019 zzzz Services
2020 zzzz Services
代碼(MultiIndex 的第 0 級)用於識別面板中的單個和唯一單元。 每個單元的觀察時間超過 3 年(MultiIndex 的第 1 級)。
當我groupby('Industry')
時,我最終會重復計算單位,因為同一個股票代碼與多個行業相關聯(如股票代碼“BBB”)。
目標是識別和打印存在此問題的代碼,並將它們分配給單個行業。
如果行業列中的字符串不是唯一的,我正在考慮一些返回代碼的代碼,以便我以后可以手動更改它。
謝謝你的幫助!
PS這是我在這里的第一個問題,所以如果您希望我更具體或顯示有關 df 的更多詳細信息,請告訴我
如果每個Ticker
的所有Industry
值都應該相同,那么您應該反過來執行此操作。
不要在Industry
上使用groupby()
,而是在Ticker
上使用groupby()
,然后循環遍歷數據幀並僅返回那些grouped_df.Ticker.nunique() > 1
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.