Python - 数据科学之相关性

  • 简述

    相关性是指一些涉及两个数据集之间依赖关系的统计关系。依赖现象的简单示例包括父母的外貌与其后代之间的相关性,以及产品价格与其供应量之间的相关性。
    我们以 seaborn python 库中可用的 iris 数据集为例。在其中,我们试图建立三种鸢尾花萼片和花瓣的长度和宽度之间的相关性。基于发现的相关性,可以创建一个强大的模型,可以很容易地将一个物种与另一个物种区分开来。
    
    import matplotlib.pyplot as plt
    import seaborn as sns
    df = sns.load_dataset('iris')
     
    #without regression
    sns.pairplot(df, kind="scatter")
    plt.show()
    
    它的输出如下 -
    关联关系.png