单变量值分组

科技工作者之家 2020-11-17

单变量值分组是统计学中的术语,属于数值型数据分组方法的一种,是把每一个变量值作为一组。这种分组方法通常只适合于离散变量且变量值较少的情况。

基本内容统计分组是数据整理中的一项重要工作,是指根据统计研究的目的和客观现象的内在特点,按某个变量(或几个变量)把被研究的总体划分成为若干个不同性质的组,然后再统计出各组的频数,就形成了一张频数分布表。分组时所依据的特征或标准称为统计分组标志,它有品质标志和数量标志两种。

按数量标志分组时,可先将数据进行排序,然后再根据需要进行分组。按数量标志分组的方法很多,主要有两种:一是单变量值分组,二是组距分组。1

比较单变量值分组是把每一个变量值作为一组,这种分组方法通常只适合于离散变量,且变量值较少的情况下使用。在数据较多的情况下,单变量值分组由于组数较多而不便于观察数据分布的特征和规律,而且对于连续变量或变量值较多的情况,可采用组距分组。

组距分组是将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。组距分组是数值型数据分组的基本形式。离散变量的整数值如果变动幅度较大,而且总体单位数N又很大,则也要进行组距分组。2

举例单变量值分组就是将一个变量值作为一组,总体中有几个不同的离散型变量值就分几个组,适合变量值较少的情况。

例1.居民家庭按照人口数进行分组,可分为1口人家庭、2口人家庭、3口人家庭、4口人家庭、5口人以上家庭的组别。

例2.某班级同学按照网购次数进行单变量值分组可以分为1次、2次、3次、4次以上。

应用统计整理是对调查过程中得到的大量统计资料加工整理、汇总、列表的过程,处于统计工作的中间环节,起着承前启后的作用。准确使用单数量值分组和组距分组是数据整理过程中的一个关键环节,不仅直接影响统计资料整理的科学性和准确性,而且最终影响着统计分析结果的真实性。3

本词条内容贡献者为:

王海侠 - 副教授 - 南京理工大学

科技工作者之家

科技工作者之家APP是专注科技人才,知识分享与人才交流的服务平台。