Python 机器学习正态数据分布
-
正态数据分布
在上一章中,我们学习了如何创建给定大小且在两个给定值之间的完全随机数组。在本章中,我们将学习如何创建一个将值集中在给定值周围的数组。在概率论中,在数学家卡尔·弗里德里希·高斯提出了这种数据分布的公式之后,这种数据分布被称为正态数据分布或高斯数据分布。典型的正态数据分布:import numpy import matplotlib.pyplot as plt x = numpy.random.normal(5.0, 1.0, 100000) plt.hist(x, 100) plt.show()
输出如下所示:注意:由于正态分布图具有钟形的特征形状,因此也称为 钟形曲线。
直方图解释::我们使用numpy.random.normal() 方法中的数组(具有100000个值)绘制具有100条的直方图。我们指定平均值为5.0,标准差为1.0。这意味着该值应在5.0左右达成一致,并且很少偏离均值1.0。从直方图中可以看到,大多数值在4.0到6.0之间,最高值大约是5.0。