[英]code for value.counts() in columns pretaining to a specific value in one column
我是數據科學的新手,正在嘗試使用iPython Notebook中的python 2.7處理一些數據。 我在第一個項目中遵循的教程要求我將所有NaN整數替換為0或1。但是我想考慮另一種方法,我可以首先查看具有與所有行相對應的非數字值的行的計數擁有credit_history為NaN ...
當Credit_History為NaN時的理想輸出:
Self_Employed
Yes 532
No 32
Married
No 398
Yes 213
對於數值,當credit_history為NaN時,我想獲取所有列的均值
當Credit_History為NaN時,非數字值的理想輸出:
Mean Applicant Income: 54003.1232
LoanAmount: 35435.12
Loan_Amount_Term: 360
提前致謝!
對於值計數,可以使用pd.Series.value_counts
:
df.loc[pd.isnull(df['Credit_History']), 'Self_Employed'].value_counts()
df.loc[pd.isnull(df['Credit_History']), 'Married'].value_counts()
為了計算平均值,可以使用pd.DataFrame.mean
:
cols = ['Applicant_Income', 'LoanAmount', 'Loan_Amount_Term']
df.loc[pd.isnull(df['Credit_History']), cols].mean()
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.