[英]R: Comparing oddly indexed vectors
我有一些難以處理的數據。 有兩個矢量在沿物理對象的點處進行質量度量(從0-1開始)。 根據從物體底部進行測量的距離對這些測量進行索引。 然后,將質量改善的轉換應用於對象,然后再次進行測量。 但是,測量的數量不同,進行測量的點也不相同。
在R中,數據看起來像這樣(但還有更多點)
轉換前:
value index
[1,] 0.3 6
[2,] 0.6 16
[3,] 0.1 25
[4,] 0.8 37
[5,] 0.2 46
[6,] 0.4 58
[7,] 0.4 64
[8,] 0.2 76
轉換后:
value index
[1,] 0.3 1
[2,] 0.5 9
[3,] 0.7 18
[4,] 0.4 30
[5,] 0.9 44
[6,] 0.3 48
[7,] 0.4 61
[8,] 0.5 66
[9,] 0.3 76
[10,] 0.1 85
假設沿着對象的質量是連續的(如果不是在每個點都觀察到),並且在轉換過程中改進的量取決於沿着對象的點,我希望能夠顯示質量改進的分布。
由於測量數量和索引不同,我不認為
plot(density(after$value - before$value))
是我要的東西。 我的問題是,是否有一種理智的方法來消除這種差異,以便使我對質量有多大提高有很多觀察? 還是我會停留在研究均值差異上?
也許這就是您想要的:要在同一圖形上顯示“轉換前”和“轉換后”的索引與值的平滑曲線,以便可以直觀地看到質量的總體“改善”:下面是一些模擬數據。
bef <- .2 + 2*((1:1000)/1000 - .5)^2 + round(rnorm(1000),1)/100
aft <- bef * (1 + rnorm(1,.7,.2))
bef.samp <- sample(1:1000, 100)
aft.samp <- sample(1:1000, 60)
bef.df <- data.frame( value = bef[ bef.samp ], index = bef.samp )
aft.df <- data.frame( value = aft[ aft.samp ], index = aft.samp )
bef.aft <- rbind( cbind(when = 'bef', bef.df), cbind( when = 'aft', aft.df))
ggplot(bef.aft, aes(index,value)) +
geom_smooth(aes(colour = when), se=0, size=1) +
geom_point(aes(colour=when))
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.