[英]Appending sample number to X-Labels in altair
我想自動 append 樣本#(在括號中)對應於 altair 圖形的 x-labels。 我願意在 altair 之外執行此操作,但我認為可能有一種方法可以使用 altair/vega-lite 在圖形級別執行此操作。 我正在使用來自 altair/vega 網站(vega_dataset 的一部分)的示例粘貼代碼,但使用了一種陳舊的手動方法,在該方法中,我為其中一個標簽顯式地重命名了標簽。 在這種情況下,我已將樣本編號 73 添加到歐洲。
import altair as alt
from vega_datasets import data
df = data.cars()
df['Origin'] = df['Origin'].replace({'Europe':'Europe (n=73)'})
alt.Chart(df).transform_density(
'Miles_per_Gallon',
as_=['Miles_per_Gallon', 'density'],
extent=[5, 50],
groupby=['Origin']
).mark_area(orient='horizontal').encode(
y='Miles_per_Gallon:Q',
color='Origin:N',
x=alt.X(
'density:Q',
stack='center',
impute=None,
title=None,
axis=alt.Axis(labels=False, values=[0],grid=False, ticks=True),
),
column=alt.Column(
'Origin:N',
header=alt.Header(
titleOrient='bottom',
labelOrient='bottom',
labelPadding=0,
),
)
).properties(
width=100
).configure_facet(
spacing=0
).configure_view(
stroke=None
)
您可以使用 pandas 生成替換字典並將其分配給新的 dataframe 列:
import altair as alt
from vega_datasets import data
df = data.cars()
group_sizes = df.groupby('Origin').size()
replace_dict = group_sizes.index + ' (n=' + group_sizes.astype(str) + ')'
df['Origin_with_count'] = df['Origin'].replace(replace_dict)
alt.Chart(df).transform_density(
'Miles_per_Gallon',
as_=['Miles_per_Gallon', 'density'],
extent=[5, 50],
groupby=['Origin_with_count', 'Origin']
).mark_area(orient='horizontal').encode(
y='Miles_per_Gallon:Q',
color='Origin:N',
x=alt.X(
'density:Q',
stack='center',
impute=None,
title=None,
axis=alt.Axis(labels=False, values=[0],grid=False, ticks=True),
),
column=alt.Column(
'Origin_with_count:N',
header=alt.Header(
title=None,
labelOrient='bottom',
labelPadding=0,
),
)
).properties(
width=100
).configure_facet(
spacing=0
).configure_view(
stroke=None
)
不確定,您也許可以使用labelExpr
做一些更優雅的事情。
您可以用計數覆蓋文本標記。
我能夠使用以下代碼做到這一點。 由於某種原因,我無法管理文本的 y position(參見注釋掉的行)或使用 header labelExpr 中的 n 數據。
df = data.cars()
violin = alt.Chart(df).transform_density(
'Miles_per_Gallon',
as_=['Miles_per_Gallon', 'density'],
extent=[5, 50],
groupby=['Origin']
).mark_area(orient='horizontal').encode(
y='Miles_per_Gallon:Q',
color='Origin:N',
x=alt.X(
'density:Q',
stack='center',
impute=None,
title=None,
axis=alt.Axis(labels=False, values=[0],grid=False, ticks=True),
),
).properties(width=100)
text = alt.Chart(df).mark_text().transform_aggregate(
cnt='count()',
groupby=["Origin"]
).transform_calculate(
n = "'n=' + datum.cnt",
).encode(
# y=alt.Y('mean(Miles_per_Gallon):Q'),
text=alt.Text('n:N'),
)
(violin + text).facet(
column=alt.Column('Origin:N'),
).configure_header(
labelExpr="[datum.value, datum.n]",
)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.