[英]Plotly: Categorical scatterplot formatting
我在使用 pandas 和 plotly 正確格式化散點圖時遇到問題。 我想實現類似於下面的 plot 的東西(使用谷歌表格創建)。
使用 google colab pandas 和 plotly 使用完全相同的數據我有一個完全不同的可視化,其中所有點都放在一個網格上,這使得可視化異常值非常困難。
如何使用 python 從谷歌表格中獲得類似於 plot 的結果? 最好是 plotly 中的交互式。
import numpy as np
import pandas as pd
import hvplot.pandas
import plotly.express as px
import matplotlib.pyplot as plt
worksheet= spreadsheet.worksheet('left_to_right') ;
# get_all_values gives a list of rows.
rows = worksheet.get_all_values()
df = pd.DataFrame(rows)
headers = df.iloc[0]
cols = list(df.columns)
pd.options.plotting.backend = "plotly"
df.plot(
kind='scatter',
x=cols[0],
y=cols[1:],
width=1500,
height=1000
)
數據集鏈接: https://docs.google.com/spreadsheets/d/1NOHH9dUEAhRjrl0NWq_zUIgzUdYfupJjuEaXyRmTFEY/edit?usp=sharing
您可以使用 Plotly Express制作條形圖,請參見下面的代碼示例。
import pandas as pd
import plotly.express as px
# load the data
df = pd.read_csv('Data.csv', header=None)
# prepare the data
df = df.melt(id_vars=df.columns[0])
df = df.drop(labels=['variable'], axis=1)
df.columns = ['variable', 'value']
df = df.sort_values(by='variable')
df = df.reset_index(drop=True)
df
# variable value
# 0 Amygdala 1.066667
# 1 Amygdala 1.057650
# 2 Amygdala 1.117117
# 3 Amygdala 1.007353
# 4 Amygdala 0.979522
# ... ...
# 1075 Thalamus 1.019973
# 1076 Thalamus 1.001422
# 1077 Thalamus 1.037945
# 1078 Thalamus 0.963793
# 1079 Thalamus 1.012915
# plot the data
fig = px.strip(df, x='variable', y='value', color='value', stripmode='overlay')
fig.update_layout(plot_bgcolor='white',
paper_bgcolor='white',
showlegend=False,
xaxis=dict(title=None, linecolor='gray', mirror=True),
yaxis=dict(title=None, linecolor='gray', mirror=True))
fig.show()
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.