簡體   English   中英

Plotly:如何從 pandas Z6A8064B5DF47945550DZ553 的 pandas Z6A8064B5DF47945550DZ553 制作一條線 plot?

[英]Plotly: How to make a line plot from a pandas dataframe with a long or wide format?

(這是一個自我回答的帖子,通過不必解釋 plotly 如何最好地處理長寬格式數據來幫助其他人縮短他們對 plotly 問題的答案)


我想在盡可能少的行中基於 pandas dataframe 構建一個 plotly 圖。 我知道你可以使用 plotly.express 來做到這一點,但這對於我稱之為標准 pandas dataframe 的東西來說是失敗的; 描述行順序的索引,以及描述 dataframe 中值名稱的列名稱:

樣品 dataframe:

    a           b           c
0   100.000000  100.000000  100.000000
1   98.493705   99.421400   101.651437
2   96.067026   98.992487   102.917373
3   95.200286   98.313601   102.822664
4   96.691675   97.674699   102.378682

一次嘗試:

fig=px.line(x=df.index, y = df.columns)

這會引發錯誤:

ValueError:所有 arguments 應具有相同的長度。 參數y的長度是 3,而前面的 arguments ['x'] 的長度是 100`

在這里,您嘗試使用寬格式的 pandas dataframe 作為px.line的來源。 plotly.express旨在與長格式的數據幀一起使用,通常被稱為整潔數據看一看。沒有人能比 Wickham 更好地解釋它)。 許多人,尤其是那些因多年與 Excel 的斗爭而受傷的人,經常發現以寬格式組織數據更容易。 那么有什么區別呢?

寬格式:

  • 數據與每個不同的數據變量一起顯示在單獨的列中
  • 每列只有一種數據類型
  • 缺失值通常由np.nan表示
  • 最適合plotly.graphobjects ( go )
  • 線條通常使用fid.add_traces()添加到圖形中
  • colors 通常分配給每個跡線

例子:

            a          b           c
0   -1.085631    0.997345   0.282978
1   -2.591925    0.418745   1.934415
2   -5.018605   -0.010167   3.200351
3   -5.885345   -0.689054   3.105642
4   -4.393955   -1.327956   2.661660
5   -4.828307    0.877975   4.848446
6   -3.824253    1.264161   5.585815
7   -2.333521    0.328327   6.761644
8   -3.587401   -0.309424   7.668749
9   -5.016082   -0.449493   6.806994

長格式:

  • 數據顯示一列包含所有值,另一列列出值的上下文
  • 缺失值根本不包含在數據集中。
  • 最適合plotly.express ( px )
  • colors 由默認顏色循環設置並分配給每個唯一變量

例子:

    id  variable    value
0   0   a        -1.085631
1   1   a        -2.591925
2   2   a        -5.018605
3   3   a        -5.885345
4   4   a        -4.393955
... ... ... ...
295 95  c        -4.259035
296 96  c        -5.333802
297 97  c        -6.211415
298 98  c        -4.335615
299 99  c        -3.515854

go如何從寬變

df = pd.melt(df, id_vars='id', value_vars=df.columns[:-1])

下面的兩個片段將產生完全相同的 plot:

在此處輸入圖像描述

如何使用px轉plot長數據?

fig = px.line(df, x='id', y='value', color='variable')

如何使用 go 到 plot 寬數據?

colors = px.colors.qualitative.Plotly
fig = go.Figure()
fig.add_traces(go.Scatter(x=df['id'], y = df['a'], mode = 'lines', line=dict(color=colors[0])))
fig.add_traces(go.Scatter(x=df['id'], y = df['b'], mode = 'lines', line=dict(color=colors[1])))
fig.add_traces(go.Scatter(x=df['id'], y = df['c'], mode = 'lines', line=dict(color=colors[2])))
fig.show()

從表面上看, go更復雜,或許更靈活? 嗯,是。 和不。 您可以使用px輕松構建圖形並添加您喜歡的任何go object!

完整的 go 片段:

import numpy as np
import pandas as pd
import plotly.express as px
import plotly.graph_objects as go

# dataframe of a wide format
np.random.seed(123)
X = np.random.randn(100,3)  
df=pd.DataFrame(X, columns=['a','b','c'])
df=df.cumsum()
df['id']=df.index

# plotly.graph_objects
colors = px.colors.qualitative.Plotly
fig = go.Figure()
fig.add_traces(go.Scatter(x=df['id'], y = df['a'], mode = 'lines', line=dict(color=colors[0])))
fig.add_traces(go.Scatter(x=df['id'], y = df['b'], mode = 'lines', line=dict(color=colors[1])))
fig.add_traces(go.Scatter(x=df['id'], y = df['c'], mode = 'lines', line=dict(color=colors[2])))
fig.show()

完整的 px 片段:

import numpy as np
import pandas as pd
import plotly.express as px
from plotly.offline import iplot

# dataframe of a wide format
np.random.seed(123)
X = np.random.randn(100,3)  
df=pd.DataFrame(X, columns=['a','b','c'])
df=df.cumsum()
df['id']=df.index

# dataframe of a long format
df = pd.melt(df, id_vars='id', value_vars=df.columns[:-1])

# plotly express
fig = px.line(df, x='id', y='value', color='variable')
fig.show()

我將把它添加為答案,以便有據可查。 首先感謝@vestland。 這是一個反復出現的問題,因此很高興能夠解決這個問題,並且標記重復的問題可能更容易。

Plotly Express 現在接受寬格式和混合格式數據,您可以在這篇文章中查看。

您可以將 pandas 繪圖后端更改為使用plotly

import pandas as pd
pd.options.plotting.backend = "plotly"

然后,要得到一個無花果,你需要寫的是:

fig = df.plot()

fig.show() 的結果

fig.show()顯示上圖。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM