中国卫生统计
    主页 > 期刊导读 >

对一道常见统计应用题解法的质疑

在统计应用题中,常会遇到通过计算标准差系数判断不同产品(品种)稳定性及推广价值的题目。标准差系数是衡量离散程度的一个标志变异指标,它反映了变量值的离中趋势,说明总体各单位标志值之间的差异大小或变异程度。标准差系数等于标准差与平均数的比值,在平均数差异不大时,标准差系数小的离散程度更低。此类题目实践性强,具有很好的检验学习效果和训练思维能力的作用。

一、一道常见习题及答案

某农科站将甲、乙两种水稻品种分别在五块试验田上试种,产量资料如下。假定生产条件相同。要求分别计算两种品种的单位面积产量,计算两种产品亩产量的标准差和离散系数,并分析哪一个品种具有较大的稳定性和推广价值。

该题及类似题目常见于数学及统计学课程的教材、习题集及试题中,一些学校的精品课程网站、复习资料中也将其作为典型试题。本文以“考试资料网”收录的《统计学综合练习题库》中的解答为例进行探讨。解法如下:

(1)甲品种统计指标计算

(3)结论

乙品种平均产量略高于甲品种,且V乙﹤V甲说明乙品种具有产量优势且较为稳定,更值得推广。

该解法被大部分教材及辅导资料作为标准答案。

二、该解法存在的问题

1.单位面积产量的计算不合理

本题用总产量除以总试验田面积求单位面积产量,看似没有问题,一般在求解平均产量时都这样计算。该指标综合反映了生产结果(包括土地肥沃程度,作物的优越性,劳动生产率等)的一般水平,更多的是用于事后的验证。但若在选种和对比试种阶段,用这种算法计算平均产量,则恰恰混淆了种子的适应性。本题中,五块试验田的面积差异达到30~40%,占地面积较大试验田的单产就会影响总体的单位面积产量。若较大面积的田块相对贫瘠,则平均单产就会被拉低,反之则偏高。因此,笼统用总产量除以总面积,求单位面积产量并不合理。如果每块试验田的面积相等,则能够规避上述问题。如果无法找到面积相等的试验田,用每块试验田单位产量的算术平均数作为单位面积产量,更能反映种子的稳定性和适应性。

2.试种面积影响加权平均单位面积产量的推演可见,面积扩大10%后,单位面积产量提高了1.8%,标准差增加了8.6%。显然,仅少量增加试种面积,由于权数发生了变化,加权平均单位产量随即变化。如果将甲产品的试验面积增加到6亩与乙产品相同,那么甲品种的平均产量还将进一步变化。可见,不同试验田块的面积大小成为了影响统计指标的重要因素,原本需要检验的种子性状原因被干扰和模糊。

基于以上分析,笔者怀疑该解法未能真实反映平均产出率,尤其是在两个品种产量的标准差较为接近时,该算法求得的离散系数受平均值影响较大,而平均值受到了试种面积的干扰。带着这个疑惑,暑假期间,笔者请教了安徽省农科院的小麦专家刘泽博士,了解了农作物试种方面的科学知识。

三、对农业生产实际的调查与理解

1.新作物试种的设计及统计

刘泽博士介绍,农业科研统计要建立在科学的实验设计基础上,两种作物的好与坏,是否值得推广,要比较产量、稳定性、抗病虫害、抗倒伏、营养成分、口感等多种因素。如果两个品种的其他性质相仿,主要考察在不同土地上的产量稳定性,并据以确定推广价值。遇到此类问题,首先,甲乙两组选择的试验田要环境类似,生产条件尽可能相同,以方便作对比实验;其次,农业试验要求有重复,一般至少3次以上,目的是为了避免单次试验可能带来的误差;再次,同期试种,试验田的选择要有代表性,选取的5块试验田应涵盖目标种植区域的主要土壤类型。试验完成后对产量进行统计分析,在产量差异显著的情况下,优先选用高产品种。在产量差异不显著时,应考虑广适性,需比较两品种的标准差与离散系数。如果某品种的变异指标值较小,则说明其稳产性和生态适应性更优。只有设计科学的对比实验,其统计数据才有意义。

2.单位面积产量的计算与权数的确定

刘泽博士进一步介绍,事实上,每个田块单位产量之间的差异,一方面是由田块的环境因素造成的(所以对比组要求类似),另一方面是由种子性状的稳定性决定的(这正是试种检验的目的)。稳定性与可靠性强的品种适应性好,能保持较为均衡的产出率,在不同地块上的产量差异小,统计结果显示为标准差较小、离散系数较低。反之则相反。实际中,科研人员会在每个试验点分别计算平均单产,然后算出该品种所有试验点的算术平均数,这个平均数即是各试验点单位产量的集中趋势,在此基础上计算标准差与离散系数(也就是统计上的离中趋势)。此时,不再考虑面积,不能用总产量除以总面积,因为假设最大产量的点面积特别大,其对点与点间的真实产量表达会形成巨大干扰。笔者查阅了相关农产品试种的学术论文,发现在统计平均产量时,的确是将各试种点平均产量算术平均得来,如在《9个玉米新品种引种试种评价》一文中,科研人员即是将南宁、柳州、河池、贵港、桂林五个试种点的平均单产算术平均后,得到该品种的平均产量。