中位数与平均数

中位数和平均数一样,也是描述一组数据集中趋势的统计量,但它和平均数有以下两点不同:一是平均数只是一个“虚拟”的数,即一组数据的和除以该组数据的个数所得的商,而中位数并不完全是“虚拟”数,当一组数据有奇数个时,它就是该组数据顺序排列后最中间的那个数据,是这组数据中真实存在的一个数据;二是平均数的大小与一组数据里的每个数据都有关系,任何一个数据的变动都会引起平均数大小的改变,而中位数则仅与一组数据的排列位置有关,某些数据的变动对中位数没有影响,所以当一组数据的个别数据偏大或偏小时,用中位数来描述该组数据的集中趋势就比较合适。

在讲中位数的概念时,还要注意一组数据的中位数只有一个,在数据个数为奇数的情况下,中位数是这组数据最中间的那个数据;在数据个数为偶数的情况下,中位数是最中间两个数据的平均数。

(1)例4。

本例通过解决“用什么数表示第3组同学的掷沙包水平比较合适”这一问题,引出了中位、数的概念。在第一学段,学生已知道用平均数来描述一组数据的总体情况比较方便和适用,但平均数与一组数据中的每个数据都有直接的关系,任意一个数据大小的变化都会对平均数值产生影响。例如本例,因为个别数据偏大,导致平均数不能很好地反映第3组同学掷沙包的一般水平。由此矛盾,就要求我们寻找新的统计量来“弥补”平均数在描述某些数据组时的不足,从而很自然地引人中位数的概念。

教学时,应把握好以下几个层次:一是引入中位数的必要性;二是定义中位数的概念时,要突出中位数的统计意义;三是阐明中位数与平均数各自的特点和适用范围。

首先,教师可出示统计表,提出问题:你们觉得第3组同学掷沙包的一般水平应该是多少呢?学生可能会估计他们的一般成绩在23~25米之间,然后再让学生算出该组数据的平均数是27.7,从而发现与他们的估计有较大出入,引起学生的认知冲突,然后引导学生发现大多数同学的成绩都低于平均值,说明用平均数来表示第3组同学掷沙包的一般水平不太合适,由此引出中位数。

教学时应把中位数特点讲清楚,让学生明白:把一组数据按大小顺序排列后,最中间的数据就是中位数,它的优点是不受偏大或偏小数据的影响。如在本例中,因为有两个同学的成绩太高,严重偏离了大多数同学的水平,这时用中位数来表示第3组同学掷沙包的一般水平就比较合适。在教学怎样求中位数时,要强调“中位”是相对一组数据的数值大小顺序而言的,计算中位数前首先应将该组数据按照大小顺序进行排列,再找出处于最中间位置的数据。

最后,教师可适当小结一下,使学生认识到平均数与中位数都是反映一组数据集中趋势的统计量,但针对具体的一组数据来说,则应根据数据组中各个数据的分布情况,合理选择适当的统计量。如当一组数据中某些数据严重偏大或偏小时,就最好选用中位数来表示该组数据的一般水平。

(2)例5。

设计本例的目的是使学生进一步理解中位数的概念,掌握求中位数的方法,另外更重要的一点是让学生体会中位数在统计学上的作用。

本例呈现了几名男生的跳远成绩,并从平均数和中位数两个角度对该数据组进行了分析,结果表明用中位数代表这组成绩的一般水平更合适。针对给定的一组数据,判断某个统计量优劣的标准就是该统计量是否包含了数据组足够多的信息量,是否很好地反映了该组数据的大部分特征,也即该统计量蕴涵了更多的有关该组数据的信息。对例5而言,7名男生跳远成绩的平均数是2.96,中位数是2.89,分析发现有5名男生的成绩都低于平均值,从而说明在这里用平均数来代表该组成绩不太合适,应选用中位数。为让学生更完整地掌握求给定一组数据的中位数的方法,在本例最后,有意将原数据组的7个数据变成了8个,以向学生介绍当一组数据有偶数个数据时中位数的求法。

教学时,先出示五(2)班?名男生的跳远成绩统计表,让学生根据统计表说说用什么数来代表该组数据比较合适,引导学生从已经学过的两个统计量的角度进行思考。在学生计算中位数时,本例与例4不同之处是统计表中7个数据还没有按大小顺序排列,故应先调整统计表中各数据的位置,使之有序排列,然后再仿例4进行计算。可让学生通过小组讨论的形式来分析平均数和中位数的特点,并引导他们结合本例的实际情况,以做出合理的选择。

(3)关于练习二十三中一些习题的说明和教学建议;

第1题,教学时,可以先让学生根据7名同学的成绩估一估他们跳绳的一般水平大约应是多少,然后再分别计算出平均数和中位数,比较后发现用中位数140来表示该小组同学跳绳的一般水平合适,因为平均数是144,而7人中有5人的成绩都低于该数值,所以不具有代表性。进一步探究会发现,造成平均数偏大的原因是7人中有一个同学的成绩是172,大大高于该组同学的一般水平,从而抬高了平均数。

第2题,本题的编写意图有两点:一是使学生认识到当一组数据中没有特别偏大或偏小的数据时,平均数和中位数这两个统计量都能较好地反映该组数据的情况;二是让学生初步理解中位数与平均数的大小关系,使学生对以下事实有所感悟:当一组数据中所有比中位数小的数与中位数之差的和小于所有比中位数大的数与中位数之差的和时,中位数就比平均数小,反之中位数就比平均数大。如在本题中,中位数是 (15+17)=16,比16小的所有数据与中位数之差的和是7+4+1=12,比16大的所有数据与中位数之差的和是1+5+14=20,因为12<20,所以中位数就比平均数小。实际教学时,不必在理论上讲得这么深刻和严密,只要学生能理解以下事实就行:如果一组数据中个别数据严重偏大,则往往会抬高平均数,使平均数大于中位数;反之,则会使平均数小于中位数;此外,如果一部分数据严重偏大,而另一部分的数据严重偏小,则通过相互抵消,往往会促使平均数接近中位数。

第3题,通过展示两个公司职工工资情况统计表,说明在生活中要特别警惕平均数的误用,要看清在平均数掩盖下的事实真相,以帮助我们在生活中作出科学合理的选择。在本题里,“乙公司说他们职工的月平均工资超过1500元,比甲公司高”,虽然这种说法没有错,但这里的平均工资并不能真正代表公司职工工资的一般水平,因为我们稍加留意就会发现,乙公司经理的工资差不多是普通职员工资的6倍,更是临时工的13倍,副经理的工资与普通员工

工资的差距同样十分悬殊,这无形中就把公司职工工资的平均水平抬高了,所以用平均工资来反映该公司职工工资的一般水平并不合适。同理,甲公司的平均工资也不能代表职工工资的一般水平。

普通职员在公司里占绝大多数,所以他们的工资更能代表公司职工工资的一般水平,这实际上也是工资统计表里的中位数,从而也与前面学习的用“中位数代表全体数据的一般水平更合适”相一致。

如果爸爸想应聘公司的员工,从工资水平的角度考虑应该选择甲公司,因为甲公司普通职员的工资是1200元,高于乙公司的1100元。

第4题,这是一道实践活动题,同时又是一道开放题,可让学生小组合作开展调查活动。首先是确定需要调查的内容,如可按教材提示调查本班同学视力情况,也可调查一个年级学生的身高、体重等,并制定好相应的调查计划,作好统计表,然后在全班(全年级或全校)的同学中进行调查。调查后把结果反映在设计好的统计表里,由此求出所收集数据的中位数,特别应让学生说说中位数的意义。例如在视力情况的调查中,如果中位数大于近视数据,则说明全班大约一半以上的同学都没近视,反之则说明全班约有一半的同学患近视。