[英]Fill dataframe with missing data in R
我有一个代码可以计算 10x10 的每个象限有多少点,并在每个象限中显示结果
我有这个数据框
qx qy n
<dbl> <dbl> <int>
1 10 80 1
2 10 90 1
3 20 20 1
4 20 30 1
5 20 40 1
6 20 60 3
7 30 10 2
8 30 20 1
9 30 30 1
10 30 40 2
# ... with 38 more rows
这就是我创建图表的方式
ggplot() +
scale_x_continuous(breaks = seq(0, 100, by = 10)) +
scale_y_continuous(breaks = seq(0, 100, by = 10)) +
geom_text(data=df, mapping=aes(x=qx-5, y=qy-5, label=n, size=1))
如何将缺少的象限添加到数据框中?
缺少象限:
10 10 0
20 10 0
70 10 0
...etc
使用所有网格位置创建一个新的空数据框,然后用已知值填充可能会更容易。
详情见评论:
library(dplyr)
#create default matrix with all grid locations
qx <- rep(seq(10, 90, 10), each=9)
qy <- rep(seq(10, 90, 10), 9)
empty <- data.frame(qx, qy)
data<- read.table(header=TRUE, text=" qx qy n
1 10 80 1
2 10 90 1
3 20 20 1
4 20 30 1
5 20 40 1
6 20 60 3
7 30 10 2
8 30 20 1
9 30 30 1
10 30 40 2")
#merge the known data with the master matrix
answer <-left_join(empty, data, by=c("qx"="qx", "qy"="qy"))
#replace NA with 0
answer$n[is.na(answer$n)] <-0
遵循与@Dave2e 相同的逻辑,我使用tidyverse
首先创建一个包含所有网格位置组合的数据框,然后加入数据,将NA
值替换为 0,然后进行绘图。 由于我只使用数据的一个子集,因此这些值将与您问题中的网格不同。
library(tidyverse)
crossing(qx = seq(10, 100, 10), qy = seq(10, 100, 10)) %>%
left_join(., df, by = c("qx", "qy")) %>%
mutate(n = replace_na(n, 0)) %>%
ggplot(.) +
scale_x_continuous(breaks = seq(0, 100, by = 10)) +
scale_y_continuous(breaks = seq(0, 100, by = 10)) +
geom_text(mapping = aes(x = qx - 5, y = qy - 5, label = n, size = 1))
输出
数据
df <- structure(list(qx = c(10L, 10L, 20L, 20L, 20L, 20L, 30L, 30L,
30L, 30L), qy = c(80L, 90L, 20L, 30L, 40L, 60L, 10L, 20L, 30L,
40L), n = c(1L, 1L, 1L, 1L, 1L, 3L, 2L, 1L, 1L, 2L)), class = "data.frame", row.names = c("1",
"2", "3", "4", "5", "6", "7", "8", "9", "10"))
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.