簡體 English 中英

列在熊貓交叉表中混亂

[英]The columns are disarrayed in pandas crosstab

原文 2019-04-08 01:58:09 3 1 python/ pandas/ crosstab

jupyter筆記本圖像

該代碼將使用Seaborn中的Titanic數據集構建pd.crosstab。 輸出表中的列總和看起來很混亂。

import pandas as pd
import seaborn as sns

titanic = sns.load_dataset('titanic')

bin = [0,15,100]
titanic["adult"] = pd.cut(titanic.age, bin, labels=["kid","adult"])
pd.crosstab(titanic.survived, titanic.adult, normalize=True, margins=True)

我預計將有0.116246 / 0.883754 / 1.000000 ，但是在最后一行應放置列總和的位置給出0.883754 / 0.116246 / 1.000000 。

1 個解決方案

總計的翻轉/沖銷完全是由於原始age列中存在NaN值，隨后您創建的合並adult列中也存在NaN值。 您應該只將dropna=False添加到您的pd.crosstab()命令中，這將返回正確的結果：

pd.crosstab(titanic.survived, titanic.adult, dropna=False, normalize=True, margins=True)

adult   kid     adult       All
survived            
0   0.047619    0.546218    0.616162
1   0.068627    0.337535    0.383838
All 0.116246    0.883754    1.000000

熊貓：多列上的交叉表然后是Groupby

[英]Pandas: Crosstab on multiple columns then Groupby

Pandas 使用交叉表和自定義列變得獨一無二

[英]Pandas get nunique using crosstab and custom columns

將交叉表轉換為列，而無需在python中使用熊貓

[英]convert crosstab to columns without using pandas in python

多列的熊貓交叉表簡化視圖

[英]pandas crosstab simplified view of multiple columns

熊貓：使用交叉表時更改列的順序

[英]Pandas: change the order of the columns when using crosstab

Python3 — 兩列的 pandas 交叉表

[英]Python3 — pandas crosstab for two columns

如何讓熊貓交叉表總結多列的值？

[英]How to get pandas crosstab to sum up values for multiple columns?

使用交叉表在 Pandas 中聚合具有不同聚合函數的多個列

[英]Aggregate Multiple columns with different agg functions in Pandas using Crosstab

Pandas Crosstab：更改命名為格式化日期的列的順序（mmm yy）

[英]Pandas Crosstab: Change Order of Columns That Are Named as Formatted Dates (mmm yy)

Python堆疊條形圖（帶有pandas交叉表）以及FacetGrid，用於多列

[英]Python stacked barplot (with pandas crosstab) along with FacetGrid for multiple columns

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 熊貓：多列上的交叉表然后是Groupby Pandas 使用交叉表和自定義列變得獨一無二將交叉表轉換為列，而無需在python中使用熊貓多列的熊貓交叉表簡化視圖熊貓：使用交叉表時更改列的順序 Python3 — 兩列的 pandas 交叉表如何讓熊貓交叉表總結多列的值？使用交叉表在 Pandas 中聚合具有不同聚合函數的多個列 Pandas Crosstab：更改命名為格式化日期的列的順序（mmm yy） Python堆疊條形圖（帶有pandas交叉表）以及FacetGrid，用於多列

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM