Python - 数据科学之相关性
-
简述
相关性是指一些涉及两个数据集之间依赖关系的统计关系。依赖现象的简单示例包括父母的外貌与其后代之间的相关性,以及产品价格与其供应量之间的相关性。我们以 seaborn python 库中可用的 iris 数据集为例。在其中,我们试图建立三种鸢尾花萼片和花瓣的长度和宽度之间的相关性。基于发现的相关性,可以创建一个强大的模型,可以很容易地将一个物种与另一个物种区分开来。import matplotlib.pyplot as plt import seaborn as sns df = sns.load_dataset('iris') #without regression sns.pairplot(df, kind="scatter") plt.show()
它的输出如下 -