簡體   English   中英

如何可視化 R 中分類變量的頻率

[英]How to Visualize The frequency of a categorical variable in R

我的 dataframe 中有 2 個變量,我正在嘗試使用 ggplot 繪制圖形。 在 x 軸上,我想要具有每日頻率的日期。 在 y 軸上,我想要在給定日期顯示的唯一名稱的計數。

dataframe 中的變量看起來像這樣。

     Date           Name

1   2016-03-01      Joe
2   2016-03-01      Joe
3   2016-03-01      Joe 
4   2016-03-01      Mark
5   2016-03-01      Sue
6   2016-03-02      Mark    
7   2016-03-02      Joe
8   2016-03-03      Joe
9   2016-03-03      Joe
10  2016-03-03      Bill

因此,第一天 y 軸上的頻率將顯示 3,第二天顯示 2,第三天顯示 2。

我的問題是如何生成該圖表。

計算每個Date的唯一Name的數量,然后使用geom_bar / geom_col

library(dplyr)
library(ggplot2)
df %>%
  group_by(Date) %>%
  summarise(n = n_distinct(Name)) %>%
  ggplot()  + geom_col(aes(Date, n))
  #ggplot() + geom_bar(aes(Date, n), stat = "identity")

在此處輸入圖像描述

數據

df <- structure(list(Date = c("2016-03-01", "2016-03-01", "2016-03-01", 
"2016-03-01", "2016-03-01", "2016-03-02", "2016-03-02", "2016-03-03", 
"2016-03-03", "2016-03-03"), Name = c("Joe", "Joe", "Joe", "Mark", 
"Sue", "Mark", "Joe", "Joe", "Joe", "Bill")), class = "data.frame",
 row.names = c(NA, -10L))

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM