簡體   English   中英

從 Pandas 數據框中的列計數

[英]Counting from a column in a Pandas Dataframe

我試圖根據一組標准計算 Pandas 數據框列中元素的實例數。 我在幾個地方遇到了困難。

這是我目前所擁有的。 它有效地讀取 CSV,刪除重復項,並對 df2 進行排序。 我正在執行所有這些步驟,以便隔離我將來要使用的標准。 坦率地說,這甚至可能是我不需要的額外步驟。

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import seaborn as sns
# importing all required modules numpy, pyplot, and pandas

df= pd.read_csv('file.csv')
# reading the CSV file as a pandas dataframe

df2 = df.drop_duplicates(subset="MRCEmp")
df2 = df2.sort_values(["CLNum"])
# creating duplicate dataframe eliminating duplicate pairs
# sorting df2 in ascending order by column "CLNum"

clmax = df2["CLNum"].max()
clmin = df2["CLNum"].min()
# creating variables as int to define the maximum and minimum of the "CLNum: column

for n in df2["CLNum"]:  

    if n not in df2["CLNum"]:

        n = n + 1

    elif n in df2["CLNum"]:
    
        print(df2.loc[df2["CLNum"] == n])
    
        n = n + 1

我應該注意,並非所有整數都在df2["CLnum"]表示,這就是我插入第一個 for 循環的原因。

但是,在運行此腳本時,並未顯示所有行。 clmax = 728clmin = 1 ,但顯示的最后一行的 n 值為 283。我找不到為什么不顯示所有行。

嘗試熊貓value_counts函數

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM