R 语言 时间序列分析

  • R 语言 时间序列分析

    时间序列是一系列数据点,其中每个数据点都与时间戳关联。一个简单的例子是在给定的一天中,股票在不同时间点的价格。另一个例子是该地区一年中不同月份的降雨量。R语言使用许多函数来创建,操纵和绘制时间序列数据。时间序列的数据存储在称为时间序列对象的R对象中。它也是一个R数据对象,例如矢量或数据帧。
    时间序列对象是使用ts()函数创建的。
    时序分析中ts()函数的基本语法为-
    
    timeseries.object.name <-  ts(data, start, end, frequency)
    
    以下是所用参数的描述-
    • data - 是包含时间序列中使用的值的向量或矩阵。
    • start - 指定时间序列中第一个观察的开始时间。
    • end - 指定时间序列中最后一个观察的结束时间。
    • frequency - 指定每单位时间的观察次数。
    除了参数“data”外,其他所有参数都是可选的。
    - 考虑从2012年1月开始的某个地方的年降雨量细节。我们创建一个R时间序列对象,其时间为12个月,并将其绘制出来。
    
    # Get the data points in form of a R vector.
    rainfall <- c(799,1174.8,865.1,1334.6,635.4,918.5,685.5,998.6,784.2,985,882.8,1071)
    
    # Convert it to a time series object.
    rainfall.timeseries <- ts(rainfall,start = c(2012,1),frequency = 12)
    
    # Print the timeseries data.
    print(rainfall.timeseries)
    
    # Give the chart file a name.
    png(file = "rainfall.png")
    
    # Plot a graph of the time series.
    plot(rainfall.timeseries)
    
    # Save the file.
    dev.off()
    
    当我们执行上述代码时,它会产生以下结果和图表-
    
    Jan    Feb    Mar    Apr    May     Jun    Jul    Aug    Sep
    2012  799.0  1174.8  865.1  1334.6  635.4  918.5  685.5  998.6  784.2
            Oct    Nov    Dec
    2012  985.0  882.8 1071.0
    
    time
  • 不同的时间间隔

    ts()函数中的频率参数值决定了测量数据点的时间间隔。值12表示时间序列为12个月。其他值及其含义如下-
    • frequency = 12 钉住一年中每个月的数据点。
    • frequency = 4 钉住一年中每个季度的数据点。
    • frequency=6 每10分钟或每小时固定一次数据点。
    • frequency= 24 * 6 固定一天中每10分钟的数据点。
  • 多个时间序列

    通过将两个时间序列合并为一个矩阵,可以在一个图表中绘制多个时间序列。
    
    # Get the data points in form of a R vector.
    rainfall1 <- c(799,1174.8,865.1,1334.6,635.4,918.5,685.5,998.6,784.2,985,882.8,1071)
    rainfall2 <- 
               c(655,1306.9,1323.4,1172.2,562.2,824,822.4,1265.5,799.6,1105.6,1106.7,1337.8)
    
    # Convert them to a matrix.
    combined.rainfall <-  matrix(c(rainfall1,rainfall2),nrow = 12)
    
    # Convert it to a time series object.
    rainfall.timeseries <- ts(combined.rainfall,start = c(2012,1),frequency = 12)
    
    # Print the timeseries data.
    print(rainfall.timeseries)
    
    # Give the chart file a name.
    png(file = "rainfall_combined.png")
    
    # Plot a graph of the time series.
    plot(rainfall.timeseries, main = "Multiple Time Series")
    
    # Save the file.
    dev.off()
    
    当我们执行上述代码时,它会产生以下结果和图表-
    
               Series 1  Series 2
    Jan 2012    799.0    655.0
    Feb 2012   1174.8   1306.9
    Mar 2012    865.1   1323.4
    Apr 2012   1334.6   1172.2
    May 2012    635.4    562.2
    Jun 2012    918.5    824.0
    Jul 2012    685.5    822.4
    Aug 2012    998.6   1265.5
    Sep 2012    784.2    799.6
    Oct 2012    985.0   1105.6
    Nov 2012    882.8   1106.7
    Dec 2012   1071.0   1337.8
    
    time