例子
假设在HDFS目录/pig_data/中有一个名为date.txt的文件。该文件包含特定人员的出生日期详细信息,身份证,日期和时间。
001,1989/09/26 09:00:00
002,1980/06/20 10:22:00
003,1990/12/19 03:11:44
并且,我们已将这个文件以名为date_data的关系加载到Pig中,如下所示。
grunt> date_data = LOAD 'hdfs://localhost:9000/pig_data/date.txt' USING PigStorage(',') as (id:int,date:chararray);
以下是GetYear()函数的示例。它将从给定的日期时间对象中检索当前年份。因此,首先让我们使用todate()函数生成所有员工的日期时间对象,如下所示。
grunt> todate_data = foreach date_data generate ToDate(date,'yyyy/MM/dd HH:mm:ss')
as (date_time:DateTime );
grunt> Dump todate_data;
(1989-09-26T09:00:00.000+05:30)
(1980-06-20T10:22:00.000+05:30)
(1990-12-19T03:11:44.000+05:30)
现在让我们使用GetYear()函数从每个雇员的出生日期获取年份,并将其存储在名为getyear_data的关系中。
grunt> getyear_data = foreach todate_data generate (date_time), GetYear(date_time);
现在,使用Dump运算符验证getyear_data关系的内容,如下所示。
grunt> Dump getyear_data;
(1989-09-26T09:00:00.000+05:30,1989)
(1980-06-20T10:22:00.000+05:30,1980)
(1990-12-19T03:11:44.000+05:30,1990)