[英]Make an O/D table in R from a DF
各位晚上好。 我在创建基于我的 DF 的 O/D 时遇到了一些麻烦。 我的 DF 有行程编号、每个站点的索引、每个站点的出发时间和站点名称:
Trip Index Time OD
16 1 a A
16 10 b B
16 20 c C
32 1 d B
32 9 e A
32 13 f C
32 24 g D
我需要有 O/D 表,其中有 Origin 的站点名称 | 目的地的站点名称 | 每个连接的出发时间(DF 中的时间):
O D Time
A B a
A C a
B C b
B A d
B C d
B D d
A C e
A D e
C D f
以第一次旅行为例。 它从“A”站开始,到经过“B”站的客栈“C”站结束。 因此,对于“A”中的乘客,他们在“a”时间开始前往“B”的旅程,并在“a”时间开始前往“C”的旅程。 对于“B”中的乘客,他们在“b”时间开始前往“C”的旅程。 从“C”开始,这次旅行你不能 go 无处可去。 然后我们必须看到下一次旅行。 等等。
我已经开始尝试使用“for”循环,如果在 for 内有 else 开始比较第一次行程的第一行与第二次和第三次,然后将第一次行程的第二行与第三次进行比较,而不是传递到下一个旅行,因为没有第四站。 至少这是我的理由,不知道是否清楚,甚至是否有意义。
谢谢!
试试这个,用一个简单的辅助函数:
library(dplyr)
odfunc <- function(tm, od) {
mtx <- t(combn(length(od), 2))
tibble::tibble(O = od[mtx[,1]], D = od[mtx[,2]], Time = tm[mtx[,1]])
}
df %>%
group_by(Trip) %>%
do(with(., odfunc(Time, OD))) %>%
ungroup()
# # A tibble: 9 x 4
# Trip O D Time
# <int> <chr> <chr> <chr>
# 1 16 A B a
# 2 16 A C a
# 3 16 B C b
# 4 32 B A d
# 5 32 B C d
# 6 32 B D d
# 7 32 A C e
# 8 32 A D e
# 9 32 C D f
数据:
df <- read.table(header=TRUE, text="
Trip Index Time OD
16 1 a A
16 10 b B
16 20 c C
32 1 d B
32 9 e A
32 13 f C
32 24 g D")
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.