如何在 y=x 的函数的一行中编写 plt.scatter(x, y) function

Question

我正在绘制散点图 plot 以显示 dataframe 中的 null 值。 如您所见， plt.scatter() function 的表现力不够。 除非您看到前面的行，否则 list(range(0,1200)) 和 'a' 之间的关系并不清楚。 plt.scatter(x,y) 是否可以以更明确的方式编写，这样可以很容易地理解 x 和 y 是如何相关的。 就像如果有人只看到 plt.scatter(x,y)，他们就会明白它的含义。

a = []
for i in range(0,1200):
  feature_with_na = [feature for feature in df.columns if df[feature].isnull().sum()>i]
  a.append(len(feature_with_na))
plt.scatter(list(range(0,1200)), a)

Answer 1

在 x 轴上你有数字，然后在 y 轴上你想要 plot DataFrame 中的列数超过 null 值的数量。

您可以计算每列中 null 值的数量，而不是循环，并使用numpy.broadcasting ，（ [:, None] ）与您的数字数组进行比较。 这允许您指定数字的xarr ，然后在比较中使用相同的数组。

样本数据

import pandas as pd
import numpy as np
import matplotlib.pyplot as plot

df = pd.DataFrame(np.random.choice([1,2,3,4,5,np.NaN], (100,10)))

代码

# Range of 'x' values to consider
xarr = np.arange(0, 100)

plt.scatter(xarr, (df.isnull().sum().to_numpy()>xarr[:, None]).sum(axis=1))

Answer 2

ALollz 的回答很好，但如果这是你的事情，这里有一个不那么笨重的选择：

feature_null_counts = df.isnull().sum()
n_nulls = list(range(100))
features_with_n_nulls = [sum(feature_null_counts > n) for n in n_nulls]
plt.scatter(n_nulls, features_with_n_nulls)

如何在 y=x 的函数的一行中编写 plt.scatter(x, y) function

问题描述

2 个解决方案

解决方案1
0 已采纳 2021-05-13 16:29:40

样本数据

代码

解决方案2
0 2021-05-13 16:42:46

如何在 y=x 的函数的一行中编写 plt.scatter(x, y) function

问题描述

2 个解决方案

解决方案1 0 已采纳 2021-05-13 16:29:40

样本数据

代码

解决方案2 0 2021-05-13 16:42:46

解决方案1
0 已采纳 2021-05-13 16:29:40

解决方案2
0 2021-05-13 16:42:46