使用R中的colsplit重塑数据

Question

我尝试使用此代码重塑数据，但得到NA值。

require(reshape2)
dates=data.frame(dates=seq(as.Date("1988-01-01"),as.Date("2011-12-31"),by="day"))
first=dates[,1]
dates1=cbind(dates[,1],colsplit(first,pattern="\\-",names=c("Year","Month","Day")))###split by y/m/day
 head(dates1)
   dates[, 1] Year Month Day
  1 1988-01-01 6574    NA  NA
  2 1988-01-02 6575    NA  NA
  3 1988-01-03 6576    NA  NA
  4 1988-01-04 6577    NA  NA
  5 1988-01-05 6578    NA  NA
  6 1988-01-06 6579    NA  NA

Answer 1

我们可以使用cSplit的splitstacshape将定界符-分隔“日期”列。

 library(splitstackshape)
 cSplit(dates, 'dates', '-', drop=FALSE)

或extract以创建其他列

library(tidyr)
extract(dates, dates, into=c('Year', 'Month', 'Day'),
                     '([^-]+)-([^-]+)-([^-]+)', remove=FALSE)

或tidyr另一个选项（由@Ananda Mahto建议）

separate(dates, dates, into = c("Year", "Month", "Day"), remove=FALSE)

或使用base R read.table 。 我们指定sep和cbind名称，并与原始列cbind 。

cbind(dates[1],read.table(text=as.character(dates$dates),
                  sep='-', col.names=c('Year', 'Month', 'Day')))

通过使用reshape2_1.4.1 ，我可以重现该错误

  head(cbind(dates[,1],colsplit(first,pattern="-",
                   names=c("Year","Month","Day"))),2)
  #  dates[, 1] Year Month Day
  #1 1988-01-01 6574    NA  NA
  #2 1988-01-02 6575    NA  NA

使用R中的colsplit重塑数据

问题描述

1 个解决方案

解决方案1
2 已采纳 2015-09-14 08:40:23

使用R中的colsplit重塑数据

问题描述

1 个解决方案

解决方案1 2 已采纳 2015-09-14 08:40:23

解决方案1
2 已采纳 2015-09-14 08:40:23