[英]get the percentage of a grouped values based on another column pands python
[英]Python get the number of distinct values in a column grouped by another column
我有一個 dataframe 包含有關 3 家汽車經銷商及其銷售的數據。 感興趣的兩列如下所示:
dealer_id manufacturer
0 34 Audi
1 34 Audi
2 34 BMW
3 55 Audi
4 55 Ford
5 55 BMW
6 55 Ford
7 12 Mercedes
8 12 Porsche
9 12 Mercedes
10 12 Audi
簡而言之,我想將 dataframe 更改為每個制造商和每個經銷商只有一排的位置。 這樣我就可以看到每個經銷商銷售的汽車有多少不同的制造商。 我對這是如何決定的並不在意,它可以是每種類型的第一行,但我希望 output 在重置索引之前看起來像這樣:
dealer_id manufacturer
0 34 Audi
2 34 BMW
3 55 Audi
4 55 Ford
5 55 BMW
7 12 Mercedes
8 12 Porsche
10 12 Audi
df = df.drop_duplicates()
print(df)
印刷:
dealer_id manufacturer
0 34 Audi
2 34 BMW
3 55 Audi
4 55 Ford
5 55 BMW
7 12 Mercedes
8 12 Porsche
10 12 Audi
或與:
df = df.drop_duplicates(["dealer_id", "manufacturer"])
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.