將樣本編號附加到 altair 中的 X-Labels

Question

我想自動 append 樣本#（在括號中）對應於 altair 圖形的 x-labels。 我願意在 altair 之外執行此操作，但我認為可能有一種方法可以使用 altair/vega-lite 在圖形級別執行此操作。 我正在使用來自 altair/vega 網站（vega_dataset 的一部分）的示例粘貼代碼，但使用了一種陳舊的手動方法，在該方法中，我為其中一個標簽顯式地重命名了標簽。 在這種情況下，我已將樣本編號 73 添加到歐洲。

鏈接到數據

import altair as alt
from vega_datasets import data

df = data.cars()
df['Origin'] = df['Origin'].replace({'Europe':'Europe (n=73)'})

alt.Chart(df).transform_density(
    'Miles_per_Gallon',
    as_=['Miles_per_Gallon', 'density'],
    extent=[5, 50],
    groupby=['Origin']
).mark_area(orient='horizontal').encode(
    y='Miles_per_Gallon:Q',
    color='Origin:N',
    x=alt.X(
        'density:Q',
        stack='center',
        impute=None,
        title=None,
        axis=alt.Axis(labels=False, values=[0],grid=False, ticks=True),
    ),
    column=alt.Column(
        'Origin:N',
        header=alt.Header(
            titleOrient='bottom',
            labelOrient='bottom',
            labelPadding=0,
        ),
    )
).properties(
    width=100
).configure_facet(
    spacing=0
).configure_view(
    stroke=None
)

Answer 1

您可以使用 pandas 生成替換字典並將其分配給新的 dataframe 列：

import altair as alt
from vega_datasets import data

df = data.cars()
group_sizes = df.groupby('Origin').size()
replace_dict = group_sizes.index + ' (n=' + group_sizes.astype(str) + ')'
df['Origin_with_count'] = df['Origin'].replace(replace_dict)

alt.Chart(df).transform_density(
    'Miles_per_Gallon',
    as_=['Miles_per_Gallon', 'density'],
    extent=[5, 50],
    groupby=['Origin_with_count', 'Origin']
).mark_area(orient='horizontal').encode(
    y='Miles_per_Gallon:Q',
    color='Origin:N',
    x=alt.X(
        'density:Q',
        stack='center',
        impute=None,
        title=None,
        axis=alt.Axis(labels=False, values=[0],grid=False, ticks=True),
    ),
    column=alt.Column(
        'Origin_with_count:N',
        header=alt.Header(
            title=None,
            labelOrient='bottom',
            labelPadding=0,
        ),
    )
).properties(
    width=100
).configure_facet(
    spacing=0
).configure_view(
    stroke=None
)

不確定，您也許可以使用labelExpr做一些更優雅的事情。

Answer 2

您可以用計數覆蓋文本標記。
我能夠使用以下代碼做到這一點。 由於某種原因，我無法管理文本的 y position（參見注釋掉的行）或使用 header labelExpr 中的 n 數據。

df = data.cars()

violin = alt.Chart(df).transform_density(
    'Miles_per_Gallon',
    as_=['Miles_per_Gallon', 'density'],
    extent=[5, 50],
    groupby=['Origin']
).mark_area(orient='horizontal').encode(
    y='Miles_per_Gallon:Q',
    color='Origin:N',
    x=alt.X(
        'density:Q',
        stack='center',
        impute=None,
        title=None,
        axis=alt.Axis(labels=False, values=[0],grid=False, ticks=True),
    ),
).properties(width=100)

text = alt.Chart(df).mark_text().transform_aggregate(
    cnt='count()',
    groupby=["Origin"]
).transform_calculate(
    n = "'n=' + datum.cnt",
).encode(
#     y=alt.Y('mean(Miles_per_Gallon):Q'),
    text=alt.Text('n:N'), 
)

(violin + text).facet(
    column=alt.Column('Origin:N'),
).configure_header(
    labelExpr="[datum.value, datum.n]",
)

將樣本編號附加到 altair 中的 X-Labels

問題描述

2 個解決方案

解決方案1
1 已采納 2021-03-27 06:24:45

解決方案2
1 2021-03-27 18:34:09

將樣本編號附加到 altair 中的 X-Labels

問題描述

2 個解決方案

解決方案1 1 已采納 2021-03-27 06:24:45

解決方案2 1 2021-03-27 18:34:09

解決方案1
1 已采納 2021-03-27 06:24:45

解決方案2
1 2021-03-27 18:34:09