簡體   English   中英

R獲得基於其他幾列的一列的值和一列的最大值?

[英]R get the value of one column that's based on several other columns and the max of one?

我看到這樣的問題( 提取數據框中每個組中的最大值 )對於R,但是沒有一個真正滿足我的需求。

我整理的數據如下所示:

      date ticker openprice lowprice closeprice hour min
2015-11-17    EXC     28.53    28.52      28.54    9  31
2015-11-17    EXC     28.53    28.52      28.58    9  32
2015-11-17    EXC     28.57    28.54      28.57    9  33
2015-11-17    AEP     28.59    28.59      28.66    9  34
2015-11-17    AEP     28.66    28.63      28.65    9  35
2015-11-17    AEP     28.64    28.63      28.65    9  36
2015-11-18    EXC     28.53    28.52      28.54    9  31
2015-11-18    EXC     28.53    28.52      28.58    9  32
2015-11-18    EXC     28.57    28.54      28.57    9  33
2015-11-18    AEP     28.59    28.59      28.66    9  34
2015-11-18    AEP     28.66    28.63      28.65    9  35
2015-11-18    AEP     28.64    28.63      28.65    9  36

從中,我需要以小時,股票代碼和日期的最小最小值最小值,然后以小時,股票代碼和日期的最小值最大值得出closeprice的值。

上面的小樣本的解決方案將是這樣的(不完全是這樣,但是您會明白我的追求):

date, ticker, hour, hour_beginning_price, hour_end_price
2015-11-17, EXC, 9, 28.54, 28.57
2015-11-17, AEP, 9, 28.66, 28.65
2015-11-18, EXC, 9, 29.54, 29.57
2015-11-18, AEP, 9, 29.66, 29.65

這樣就可以將樣本數據加載到R中:

blep<-read.table(header = TRUE, text = '          date ticker openprice lowprice closeprice hour min
    2015-11-17    EXC     28.53    28.52      28.54    9  31
    2015-11-17    EXC     28.53    28.52      28.58    9  32
    2015-11-17    EXC     28.57    28.54      28.57    9  33
    2015-11-17    AEP     28.59    28.59      28.66    9  34
    2015-11-17    AEP     28.66    28.63      28.65    9  35
    2015-11-17    AEP     28.64    28.63      28.65    9  36
    2015-11-18    EXC     28.53    28.52      29.54    9  31
    2015-11-18    EXC     28.53    28.52      29.58    9  32
    2015-11-18    EXC     28.57    28.54      29.57    9  33
    2015-11-18    AEP     28.59    28.59      29.66    9  34
    2015-11-18    AEP     28.66    28.63      29.65    9  35
    2015-11-18    AEP     28.64    28.63      29.65    9  36')

我一直在嘗試學習如何做到這一點,並且一無所獲,我總是總是首先嘗試自己解決問題,但是我不確定如何正確地將聚合的輸出與之結合,甚至正確的方法:

which(apply(sd, function(x) all(x == aggregate(sd$min, by = list(sd$date, sd$ticker, sd$hour), max))))

這是使用dplyr的解決方案:

library(dplyr)

blep %>% 
  group_by(date, ticker, hour) %>% 
  arrange(date, ticker, hour, min) %>% 
  summarize(hour_beginning_price = first(closeprice),
            hour_end_price = last(closeprice))

關鍵是按分鍾(分鍾)排序,以便第一個記錄是每個組中分鍾的最小值,最后一個值是分鍾的最大值。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM