如何从这个熊猫数据框中制作四重条形图？

Question

我是一名新的编码员，对于我的班级，我们有一项作业，我们应该对外部数据集进行 API 调用，然后绘制有关数据的一些有趣内容。 我对纽约市树木普查数据集进行了 API 调用。 在数据中，它显示了树种和健康状况（好、一般、差、死）。 我想制作一个堆积条形图，显示每棵树的健康状况百分比。 例如，我想要一个枫树条，显示 56% 是好的，26% 是一般的，13% 是差的，5% 是死的。 我不确定如何完成所有这些。 这是一个屏幕截图，显示了我的数据集的外观。 感谢您的任何建议！

数据框截图

Answer 1

我使用 kaggle 作为数据源。 我也发现了这个API我没有使用，因为它对我来说太慢了
我使用的数据没有死树，只是状态不佳，公平和良好
我使用了pandas-percentage-of-to-groupby技术来计算百分比
我更喜欢plotly 而不是matplotlib进行绘图。 两者都易于使用
真的有太多的酒吧，这是一个高质量的可视化

从 API 获取数据（kaggle）

import kaggle.cli
import sys
import pandas as pd
from pathlib import Path
from zipfile import ZipFile

# search for data set
# sys.argv = [sys.argv[0]] + "datasets list -s \"2015-street-tree-census-tree-data.csv\"".split(" ")
# kaggle.cli.main()

# download data set
sys.argv = [sys.argv[0]] + "datasets download new-york-city/ny-2015-street-tree-census-tree-data".split(" ")
kaggle.cli.main()

zfile = ZipFile("ny-2015-street-tree-census-tree-data.zip")
zfile.infolist()

# use CSV
df = pd.read_csv(zfile.open(zfile.infolist()[0]))

使用`plotly`准备数据和绘图

import plotly.express as px

spc = 'spc_common'

# aggregate the data and shape it for plotting
dfa = (
    df.groupby([spc, "health"])
    .agg({"tree_id": "count"})
    .groupby(level=spc)
    .apply(lambda x: x / x.sum())
    .unstack("health")
    .droplevel(0, 1)
)

fig = px.bar(
    dfa.reset_index(),
    x=spc,
    y=["Poor", "Fair", "Good"],
    color_discrete_sequence=["red", "blue", "green"],
)
fig.update_layout(yaxis={"tickformat": "%"})

输出

matplotlib

import matplotlib.pyplot as plt

fig, ax = plt.subplots(figsize=(14, 3))
dfa.plot(kind="bar", stacked=True, ax=ax)

如何从这个熊猫数据框中制作四重条形图？

问题描述

1 个解决方案

解决方案1
0 2021-06-20 13:04:55

从 API 获取数据（kaggle）

使用`plotly`准备数据和绘图

输出

matplotlib

如何从这个熊猫数据框中制作四重条形图？

问题描述

1 个解决方案

解决方案1 0 2021-06-20 13:04:55

从 API 获取数据（kaggle）

使用plotly准备数据和绘图

输出

matplotlib

解决方案1
0 2021-06-20 13:04:55

使用`plotly`准备数据和绘图