簡體   English   中英

將數據幀轉換為R中的時間序列

[英]convert data frame to time series in R

我有過去兩年半的每月數據。 我想將數據幀轉換為時間序列。 所以我應該有

Start :: 2015-01-01

End :: 2017-06-01

Frequency : 1

我努力了

ts (df [, -1], start = df [1, 1], end = df [29, 1])

但是我從中得到了真正的有線輸出。

    Time Series:
    Start = 16436 
    End = 17287 
   Frequency = 1 

            date inflow
   1  2015-01-01   6434

   2  2015-02-01   5595

   3  2015-03-01   3101

   4  2015-04-01   3475

   5  2015-05-01   6519

   6  2015-06-01   7251

   7  2015-07-01   4200

   8  2015-08-01   3622

   9  2015-09-01   4782

   10 2015-10-01   6503

   11 2015-11-01   9460

   12 2015-12-01  15623

   13 2016-01-01  18393

   14 2016-02-01  14410

   15 2016-03-01  11210

   16 2016-04-01  10582

   17 2016-05-01  14316

   18 2016-06-01  11876

   19 2016-07-01  13676

   20 2016-08-01  12466

   21 2016-09-01  17326

   22 2016-10-01  15845

   23 2016-11-01  15569

   24 2016-12-01  24933

   25 2017-01-01  35050

   26 2017-02-01  26008

   27 2017-03-01  25767

   28 2017-04-01  17858

   29 2017-05-01  21089



dput(df)
structure(list(date = structure(c(16436, 16467, 16495, 16526, 
16556, 16587, 16617, 16648, 16679, 16709, 16740, 16770, 16801, 
16832, 16861, 16892, 16922, 16953, 16983, 17014, 17045, 17075, 
17106, 17136, 17167, 17198, 17226, 17257, 17287, 17318), class = "Date"), 
    inflow = c(6434L, 5595L, 3101L, 3475L, 6519L, 7251L, 4200L, 
    3622L, 4782L, 6503L, 9460L, 15623L, 18393L, 14410L, 11210L, 
    10582L, 14316L, 11876L, 13676L, 12466L, 17326L, 15845L, 15569L, 
    24933L, 35050L, 26008L, 25767L, 17858L, 21089L, 13570L)), row.names = c(NA, 
-30L), class = "data.frame", .Names = c("date", "inflow"))

提前謝謝了!!

1)動物園也許最簡單的方法是將其轉換為"zoo"類,然后從其轉換為"ts"類。 "yearmon"類是在Zoo軟件包中提供的用於表示月度數據的類,並且與ts頻率12數據緊密對應。 結果是一個"ts"類序列,其長度與df的行數相同。

library(zoo)
as.ts(read.zoo(df, FUN = as.yearmon))

##        Jan   Feb   Mar   Apr   May   Jun   Jul   Aug   Sep   Oct   Nov   Dec
## 2015  6434  5595  3101  3475  6519  7251  4200  3622  4782  6503  9460 15623
## 2016 18393 14410 11210 10582 14316 11876 13676 12466 17326 15845 15569 24933
## 2017 35050 26008 25767 17858 21089 13570  

根據您要執行的操作,您可能希望將其保留為"zoo"類時間序列,在這種情況下,請省略as.ts

1a)使用動物園的另一種方法是:

ts(df$inflow, start = as.yearmon(df$date[1]), freq = 12)

2)base這更長,但是不使用任何軟件包:

mo <- as.numeric(format(df$date[1], "%m"))
yr <- as.numeric(format(df$date[1], "%Y"))
ts(df$inflow, start = c(yr, mo), freq = 12)

如果知道該系列總是在一月份開始,那么我們可以省略mo的定義並寫:

ts(df$inflow, start = yr, freq = 12)

注意:來自問題的輸入df為:

df <- 
structure(list(date = structure(c(16436, 16467, 16495, 16526, 
16556, 16587, 16617, 16648, 16679, 16709, 16740, 16770, 16801, 
16832, 16861, 16892, 16922, 16953, 16983, 17014, 17045, 17075, 
17106, 17136, 17167, 17198, 17226, 17257, 17287, 17318), class = "Date"), 
inflow = c(6434L, 5595L, 3101L, 3475L, 6519L, 7251L, 4200L, 
3622L, 4782L, 6503L, 9460L, 15623L, 18393L, 14410L, 11210L, 
10582L, 14316L, 11876L, 13676L, 12466L, 17326L, 15845L, 15569L, 
24933L, 35050L, 26008L, 25767L, 17858L, 21089L, 13570L)), row.names = 
c(NA, 30L), class = "data.frame", .Names = c("date", "inflow"))

您的29應該是30,因為您實際上是在截止最后日期。 與其對最后的行號進行硬編碼,不如將其替換為以下功能:

ts ( df [, -1], start = df [1, 1], end = df [nrow (df), 1] )

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM