本帖最后由 张智全 于 2021-11-18 20:00 编辑
通过长方形的高代表对应组的频数(因为组距是一个常数,为了画图和看图方便,通常直接用高表示频数),这样的统计图称为频数分布直方图.它能:①清楚显示各组频数分布情况;②易于显示各组之间频数的差别
一、基本概念
1.频数:数字出现的次数有的多有的少,或者说它们出现的频繁程度不同,我们称每个对象出现的次数为频数。
注:在统计频数多少的时候,我们一般通过数“正”字的方法累计.也可使用其他方法.
2.频率:每个对象出现次数与总次数的比值为频率。
3.组数:把全体样本分成的组的个数称为组数.
4.组距:把所有数据分成若干个组,每个小组的两个端点的距离。
5.极差:是指一组数据中最大数据与最小数据的差。组距=[极差除以组数]+1([ ]表示取整)
6、频数直方图:有若干个宽等于组距、面积表示每一组频数的长方形组成的统计图
二、离散型定量变量的频率分布
对离散型定量变量,变量值的取值是不连续的。直接清点各变量值出现的频数,即为频率分布表。离散型定量变量的频率分布图可用直方图表达,以各等宽矩形直条的高度表示各频率的多少。
三、连续型定量变量的频率分布
对连续型定量变量,变量值的取值是连续的,将数据适当分组,清点各组的频数,即为频率分布表。连续型定量变量的频率分布图可用直方图表达。即纵坐标为频率密度,即频率/组距,直方图的面积之和等于1.
四、频率分布表(图)的用途
频率分布表(图)可以揭示资料的分布类型,如对称分布或偏峰分布;也可以描述资料的分布特征,即集中趋势和离散趋势;便于发现某些特大和特小的可疑值;便于进一步计算指标和统计分析。
|