簡體   English   中英

R:ggplot2中的相對頻率分類數據

[英]R: relative frequency categorical data in ggplot2

我在Rstudio工作。

使用ggplot2,我試圖形成一個圖,其中每個類別(有5個類別)的分類變量(購買的股票數量)的出現頻率。 例如,類別A的成員可能比類別D的成員更頻繁地購買1股股票。

我現在有一個計數圖。 但是,由於一個類別比其他類別大得多,因此您對其他類別中的n個份額一無所知。

計數圖的代碼如下:

#ABS. DISTRIBUTION SHARES/CATEGORY
ggplot(dat, aes(x=Number_share, fill=category)) +
  geom_histogram(binwidth=.5, alpha=.5, position="dodge")

結果顯示在此圖中: https : //imgur.com/a/e4k94

因此,我計划繪制一個繪圖,在該繪圖中您具有相對於其類別的分布而不是絕對計數。

我計算了每個類別的相對頻率

library(MASS)
categories = dat$category
categories.freq = table(categories)
categories.relfreq = categories.freq / nrow(dat)
cbind(categories.relfreq)

Categories.relfreq

博芬1 0.002708692

博芬2 0.015020931

E&B 0.037182960

益群1 0.042107855

生態動力2 0.029549372

生態動力3 0.873183945

我不知道如何繪制圖表,其中獲取股份的頻率與類別有關 ,而不是相對於類別 有人可以幫我嗎?

我想你要找的是這個

ggplot(dat, aes(x=Number_share, fill=category)) +
  geom_bar(position="fill")

這將類別彼此堆疊,而position="fill"參數將給出相對計數

我發現這個問題非常相似: R中權重的直方圖基本上是因為直方圖的默認值是使用y軸上的計數,而我想使用hist(freq = TRUE),或者ggplot:ggplot_histogram(y = ..density ..)。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM