![](/img/trans.png)
[英]Create cross-tabulation in python pandas showing which values are present
[英]Cross Tabulation for categorical values in Pandas
在下面的示例中,將兩個分類值的頻率放在一起,即“默認”和“住房”-
pd.crosstab(bd['default'],bd['housing'])
住房不是
默認
沒有19701 24695
是的 380 435
在上面的頻率表中,我們觀察到有 24695 個觀察值,其中“住房”的值為“是”,“默認”的值為“否”。這是人口的很大一部分。 在大約 435 個觀察結果中,有一小部分是“是”,而默認也是“是”。 在默認為“是”的觀察中,“住房”為“是”的觀察次數較多,即 435 次,而住房為“否”的觀察次數為 380 次。
所以我在一個示例中找到了上述解釋,但我無法正確理解該表。他們是否還說有 19701 觀察值是“否”的住房
有人可以用簡單的話或其他解釋向我簡要介紹上述觀察結果嗎?
rajarshig,您的交叉表為您提供以下信息:
housing
為否且default
為否的案例數 = 19701
housing
為否且default
為是的情況數 = 380
housing
為“是”且default
為“是”的案例數 = 435
housing
為“是”且default
為“否”的案例數 = 24695
干杯
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.