Pig RANDOM 函数

  • RANDOM 函数

    Pig Latin的RANDOM()函数是用来获得的伪随机数(类型 double)大于或等于0.0且小于1.0。
  • 句法

    这是RANDOM()函数的语法。
    
    grunt> RANDOM()
    
  • 例子

    假设在HDFS目录/pig_data/中有一个名为math.txt的文件。该文件包含整数和浮点值,如下所示。
    
    5 
    16 
    9 
    2.5 
    5.9 
    3.1 
    
    并且,我们已将这个文件通过名为math_data的关系加载到Pig中,如下所示。
    
    grunt> math_data = LOAD 'hdfs://localhost:9000/pig_data/math.txt' USING PigStorage(',') as (data:float);
    
    让我们使用RANDOM()函数计算math.txt文件内容的random值,如下所示。
    
    grunt> random_data = foreach math_data generate (data), RANDOM();
    
    上面的语句将结果存储在名为random_data的关系中。如下所示,使用Dump运算符验证关系的内容。
    
    grunt> Dump random_data;
      
    (5.0,0.6842057767279982) 
    (16.0,0.9725172591786139) 
    (9.0,0.4159326414649489) 
    (2.5,0.30962777780713147) 
    (5.9,0.705213727551145) 
    (3.1,0.24247708413861724)