卡方检验
卡方检验是一种统计方法,用于确定两个类别变量之间是否具有显着相关性。这些变量都应来自相同的种群,并且应该是分类的,例如-是/否,男性/女性,红色/绿色等。
例如,我们可以通过观察人们的冰淇淋购买模式来构建数据集,并尝试将一个人的性别与他们喜欢的冰淇淋的口味相关联。如果发现相关性,我们可以通过了解来访者的性别人数来计划适当的风味储备。
语法
用于执行卡方检验的函数是chisq.test()。
在R中创建卡方检验的基本语法是-
以下是所用参数的描述-
数据是表格形式的数据,其中包含观察值中变量的计数值。
例我们将在“MASS”库中获取Cars93数据,该数据代表了1993年不同车型的销售。
当我们执行以上代码时,它产生以下结果-
上面的结果表明,数据集具有许多可以视为分类变量的因子变量。对于我们的模型,我们将考虑变量“AirBags”和“Type”。在这里,我们的目的是找出所售汽车的类型与其所拥有的安全气囊的类型之间的任何显着相关性。如果观察到相关性,我们可以估计哪种类型的汽车在哪种类型的安全气囊上可以卖得更好。
当我们执行以上代码时,它产生以下结果-
结论
结果显示p值小于0.05,表示字符串相关。