[英]Plotly: How to make a line plot from a pandas dataframe with a long or wide format?
(這是一個自我回答的帖子,通過不必解釋 plotly 如何最好地處理長寬格式數據來幫助其他人縮短他們對 plotly 問題的答案)
我想在盡可能少的行中基於 pandas dataframe 構建一個 plotly 圖。 我知道你可以使用 plotly.express 來做到這一點,但這對於我稱之為標准 pandas dataframe 的東西來說是失敗的; 描述行順序的索引,以及描述 dataframe 中值名稱的列名稱:
a b c
0 100.000000 100.000000 100.000000
1 98.493705 99.421400 101.651437
2 96.067026 98.992487 102.917373
3 95.200286 98.313601 102.822664
4 96.691675 97.674699 102.378682
fig=px.line(x=df.index, y = df.columns)
這會引發錯誤:
ValueError:所有 arguments 應具有相同的長度。 參數
y
的長度是 3,而前面的 arguments ['x'] 的長度是 100`
在這里,您嘗試使用寬格式的 pandas dataframe 作為px.line
的來源。 plotly.express
旨在與長格式的數據幀一起使用,通常被稱為整潔數據(請看一看。沒有人能比 Wickham 更好地解釋它)。 許多人,尤其是那些因多年與 Excel 的斗爭而受傷的人,經常發現以寬格式組織數據更容易。 那么有什么區別呢?
np.nan
表示go
)fid.add_traces()
添加到圖形中例子:
a b c
0 -1.085631 0.997345 0.282978
1 -2.591925 0.418745 1.934415
2 -5.018605 -0.010167 3.200351
3 -5.885345 -0.689054 3.105642
4 -4.393955 -1.327956 2.661660
5 -4.828307 0.877975 4.848446
6 -3.824253 1.264161 5.585815
7 -2.333521 0.328327 6.761644
8 -3.587401 -0.309424 7.668749
9 -5.016082 -0.449493 6.806994
px
)例子:
id variable value
0 0 a -1.085631
1 1 a -2.591925
2 2 a -5.018605
3 3 a -5.885345
4 4 a -4.393955
... ... ... ...
295 95 c -4.259035
296 96 c -5.333802
297 97 c -6.211415
298 98 c -4.335615
299 99 c -3.515854
df = pd.melt(df, id_vars='id', value_vars=df.columns[:-1])
fig = px.line(df, x='id', y='value', color='variable')
colors = px.colors.qualitative.Plotly
fig = go.Figure()
fig.add_traces(go.Scatter(x=df['id'], y = df['a'], mode = 'lines', line=dict(color=colors[0])))
fig.add_traces(go.Scatter(x=df['id'], y = df['b'], mode = 'lines', line=dict(color=colors[1])))
fig.add_traces(go.Scatter(x=df['id'], y = df['c'], mode = 'lines', line=dict(color=colors[2])))
fig.show()
從表面上看, go
更復雜,或許更靈活? 嗯,是。 和不。 您可以使用px
輕松構建圖形並添加您喜歡的任何go
object!
完整的 go 片段:
import numpy as np
import pandas as pd
import plotly.express as px
import plotly.graph_objects as go
# dataframe of a wide format
np.random.seed(123)
X = np.random.randn(100,3)
df=pd.DataFrame(X, columns=['a','b','c'])
df=df.cumsum()
df['id']=df.index
# plotly.graph_objects
colors = px.colors.qualitative.Plotly
fig = go.Figure()
fig.add_traces(go.Scatter(x=df['id'], y = df['a'], mode = 'lines', line=dict(color=colors[0])))
fig.add_traces(go.Scatter(x=df['id'], y = df['b'], mode = 'lines', line=dict(color=colors[1])))
fig.add_traces(go.Scatter(x=df['id'], y = df['c'], mode = 'lines', line=dict(color=colors[2])))
fig.show()
完整的 px 片段:
import numpy as np
import pandas as pd
import plotly.express as px
from plotly.offline import iplot
# dataframe of a wide format
np.random.seed(123)
X = np.random.randn(100,3)
df=pd.DataFrame(X, columns=['a','b','c'])
df=df.cumsum()
df['id']=df.index
# dataframe of a long format
df = pd.melt(df, id_vars='id', value_vars=df.columns[:-1])
# plotly express
fig = px.line(df, x='id', y='value', color='variable')
fig.show()
我將把它添加為答案,以便有據可查。 首先感謝@vestland。 這是一個反復出現的問題,因此很高興能夠解決這個問題,並且標記重復的問題可能更容易。
Plotly Express 現在接受寬格式和混合格式數據,您可以在這篇文章中查看。
您可以將 pandas 繪圖后端更改為使用plotly :
import pandas as pd
pd.options.plotting.backend = "plotly"
然后,要得到一個無花果,你需要寫的是:
fig = df.plot()
fig.show()
顯示上圖。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.