频数分布

科技工作者之家 2020-11-17

频数分布(frequency distribution),亦称“次数分布”。数据的统计整理方式之一。

简介频数:数据出现的频率不同,我们称每个对象出现的次数为频数。

频率:每个对象出现的次数与总次数的比值称为频率。

分布数列的种类:根据分组标志的不同分为属性分布数列和变量分布数列;变量分布数列又有单项式数列和组距式数列。任何一个分布都必须满足:

1、各组的频率大于0;

2、各组的频率和等于1(或者说100%)

对于有序分类变量,除了给出各类别的频数和频率外,还有一个很重要的一方面:低于或者高于某类别的取值的案例的频数和频率。因为,个案之间是有等级的,知道比它们高的或者比它们低的频数或者频率,是有用的。但是,特别注意的是,统计软件只能按照类别编码从小到大进行频数和百分比的累计,如果编码不符合要求,就需要手工统计。所以,正确的编码至关重要。

步骤按照某种标志(性质或数量)将数据分成若干组,分别统计各组数据的频数(有时包括频率), 以反映数据分布在各组的情况。分组标志以及与各组对应的频数(或频率) 是频数分布的主要部分。当分组标志是数值大小时,作频数分布的步骤是:(1)求全距;(2)决定组距和组数;(3)列出组限;(4)统计各组频数或频率。频数分布可用表格或图形来表示,分别叫作频数分布表或频数分布图,便于直观地反映数据的一些分布规律。1

类型在日常生活和经济管理中,常见的频数分布曲线主要有钟形分布(正态分布、偏态分布)、J形分布、U形分布,洛伦茨分布曲线等几种类型。

钟形分布特征是“两头小,中间大”,即靠近中间的变量值分布的次数多,靠近两边的变量值分布的次数少。

J形分布主要有正J形和反J形分布。正J形是次数随着变量值的增大而增多,反J形是次数随着变量值增大而减少。

U形分布的特征与钟形分布相反,靠近中间的变量值分布次数少,2靠近两端的变量值分布的次数多。例如人口死亡现象按年龄分布便是如此。

洛伦茨分布曲线是美国统计学家格伦茨(M.Krenz)提出来的,专门用以检定社会收入分配的平等程度。洛伦茨分布曲线运作有两个条件:一是居民或家庭按收入水平分组,计算各级居民或家庭的比重;二是计算各组收入的比重。

本词条内容贡献者为:

王海侠 - 副教授 - 南京理工大学

科技工作者之家

科技工作者之家APP是专注科技人才,知识分享与人才交流的服务平台。