相当于py中R的“表”

Question

在R中，我们可以使用table找到每个项目的频率。 这是R中的一个例子：

x <- c(1,1,1,1,2,2)
y <- c("a","a","b","a","a","b")
table(x,y)
#   y
#x   a b
#  1 3 1
#  2 1 1

如何在python中实现它，而x和y是DataFrame？ 我是Python的新手，我搜索了很多，但我无法找到答案。 我应该提一下，我读过这篇文章，但我无法在我的案例中实现它？

Answer 1

我们可以用pandas crosstab做到这一点

import numpy as np;
import pandas as pd;
x = np.array([1, 1, 1, 1, 2, 2]);
y = np.array(["a", "a", "b", "a", "a", "b"]);
pd.crosstab(x, y, rownames = ['x'], colnames = ['y']);
#  y  a  b
#x
#1  3  1
#2  1  1

Answer 2

计算出现次数R：

sort(table(df$source), decreasing = TRUE)

Python熊猫：

df.source.value_counts() 
#or
df["source"].value_counts()

资料来源： R与Python - 一对一的比较

用于计算两列之间的出现次数

与R

table(cdc$gender,cdc$smoke100)

用python

pd.crosstab(index=df['gender'], columns=df['smoke100'])

资料来源：看看这个答案

相当于py中R的“表”

问题描述

2 个解决方案

解决方案1
12 已采纳 2018-01-14 17:27:20

解决方案2
4 2018-12-22 19:53:47

相当于py中R的“表”

问题描述

2 个解决方案

解决方案1 12 已采纳 2018-01-14 17:27:20

解决方案2 4 2018-12-22 19:53:47

解决方案1
12 已采纳 2018-01-14 17:27:20

解决方案2
4 2018-12-22 19:53:47