Python - 数据科学可视化之时间序列图

  • 简述

    时间序列是一系列数据点,其中每个数据点都与时间戳相关联。一个简单的例子是股票市场上某一天不同时间点的股票价格。另一个例子是一个地区一年中不同月份的降雨量。
    在下面的示例中,我们获取特定股票代码一个季度每天的股票价格值。我们将这些值捕获为 csv 文件,然后使用 pandas 库将它们组织到数据帧中。然后,我们通过将附加的 Valuedate 列重新创建为索引并删除旧的 valuedate 列,将日期字段设置为数据框的索引。
  • 样本数据

    以下是给定季度不同日期的股票价格样本数据。数据保存在名为 stock.csv 的文件中
    
    ValueDate   Price
    01-01-2018, 1042.05
    02-01-2018, 1033.55
    03-01-2018, 1029.7
    04-01-2018, 1021.3
    05-01-2018, 1015.4
    ...
    ...
    ...
    ...
    23-03-2018, 1161.3
    26-03-2018, 1167.6
    27-03-2018, 1155.25
    28-03-2018, 1154
    
  • 创建时间序列

    
    from datetime import datetime
    import pandas as pd
    import matplotlib.pyplot as plt
    data = pd.read_csv('path_to_file/stock.csv')
    df = pd.DataFrame(data, columns = ['ValueDate', 'Price'])
    # Set the Date as Index
    df['ValueDate'] = pd.to_datetime(df['ValueDate'])
    df.index = df['ValueDate']
    del df['ValueDate']
    df.plot(figsize=(15, 6))
    plt.show()
    
    它的output如下 -
    时间序列.png