代码之家 › 专栏 › 技术社区 › Banjo

分析没有日期的时间序列

forecasting time-series ggplot2 r

Banjo · 技术社区 · 5 年前

我有这样的数据:

dat
# A tibble: 34 x 2
   date_block_num  sales
            <int>  <dbl>
 1              0 131479
 2              1 128090
 3              2 147142
 4              3 107190
 5              4 106970
 6              5 125381
 7              6 116966
 8              7 125291
 9              8 133332
10              9 127541
# ... with 24 more rows

date_block_num 是每年的月份。 sales 日期块编号 0有63224行/箱,因为销售是按天计算的,并且它们指的是不同商店中的不同商品。每天分析数据也很有趣,但R不能处理这么多的数据。

我想对时间序列进行分解,以便分析趋势、季节性和随机成分。总的来说,时间序列有33个月(开始时间:2013年1月1日,结束时间:2015年10月1日)。

library(forecast)
ts(dat, frequency = 12) %>%
  decompose() %>%
  autoplot()

然而,将上述四个图中的第一个图与此图进行比较,这似乎是不对的:

plot(dat, type = "l")

structure(list(date_block_num = 0:33, sales = c(131479, 128090, 
147142, 107190, 106970, 125381, 116966, 125291, 133332, 127541, 
130009, 183342, 116899, 109687, 115297, 96556, 97790, 97429, 
91280, 102721, 99208, 107422, 117845, 168755, 110971, 84198, 
82014, 77827, 72295, 64114, 63187, 66079, 72843, 71056)), class = c("tbl_df", 
"tbl", "data.frame"), row.names = c(NA, -34L))

2 回复 | 直到 5 年前

Julius Vainora 5 年前

问题来自传递两列 dat 而不仅仅是 sales

ts(dat$sales, frequency = 12) %>%
  decompose() %>%
  autoplot()

Cettt 5 年前

ts(dat) 创建二维时间序列:

ts(dat, frequency = 12)
      date_block_num  sales
Jan 1              0 131479
Feb 1              1 128090

之后只有第一列( date_block_num )被分解了。试试这个

ts(dat$sales, frequency = 12) %>% 
  decompose() %>%
  autoplot()

推荐文章

Mchief · 基于月度数据的预测

6 年前

Nishant · 如何自动迭代绘图。使用ggplot的arima预测

7 年前

Serk · 缺少周末值且在绘图中保留日期的时间序列

7 年前

F. Suyuti · 熊猫数据帧上的滞后数据

7 年前

JimJanes · R: 时间序列日期列表-需要打破以执行ARIMA风格的预测

7 年前

Jan Boldt · 了解来自预测的错误消息。gts

7 年前

Fawad Khalil · lstm模型的输出形状

7 年前

FJ1200 · Excel 2010 Rorecast函数

7 年前

Rick Arko · 将预测合并到R中的数据框架中,然后导出到excel中

9 年前

lrclark · 使用glm-probit模型生成预测

9 年前