我国医学期刊大约有1000多种,医学统计学的应用越来越广泛。由于统计学的内容非常丰富且不断发展,医务工作者常因各种原因不愿花费许多精力钻研统计学知识,故医学论文中误用统计学的现象较为严重。为提高论文的可信度,现将医学科研论文统计学方法应用中易犯的10个错误列举出来。
1. 未交代统计学方法 如“采用SPSS软件进行统计学处理,结果P<0.01,差别具有统计学意义”。
2. 统计学方法交代不清 最常见的错误是“计量资料采用方差分析”、“计数资料采用χ2检验”、“经t检验P<0.01”等。方差分析有10多种,所对应的计量资料和实验设计不同,结果自然不同。正确的方法是要标明统计学方法、统计学软件名称、版本号、检验方法、检验水准以及检验的单双侧。
3. 未考虑应用条件 统计学方法多、公式多,且各有适用条件,应根据实验设计和资料性质进行正确选择。
4. t检验被误用 t检验是最常用的统计方法之一,是专门检验两个均数之间差异的(样本与总体、配对资料、样本与样本),但有许多误用的情况。在t检验中把配对设计的资料作成组比较的t检验是常见的失误之一,t检验误用于方差分析的现象也不少见。t检验不能用于三组或三组以上的组间比较,即使资料符合t检验的条件也是不行的。因为将原来的多组整体设计割裂失去了总变异和总剩余误差,损失了部分信息,降低了检验效率。
5. 不当检验 四格表资料,当140时,没有计算校正值;当T<1或n<40时,没有选用四格表确切概率法。行×列表资料,由于例数太少,没有采取适当的处理方法,直接计算数值,导致分析偏性。
6. 多组间两两比较出错 最常见的错误是,将三组或以上组拆开分别作两两比较。应先将所有组一起比较,差别有统计学意义后,再进行两两比较或多个处理和同一对照组比较。
7. 相关回归分析犯概念性错误 有作者将一组变量既作为自变量又作为因变量,r=1,认为有完全相关性,这说明对相关概念还不十分清楚。有作者在自变量和因变量都没有问题并且求得r=0.89的情况下,就认为两事物间有因果关系。r的实际意义只能提供两个变量是否相关的信息,却不提供相关是否有因果关系的信息。正确的方法是求得两个变量间数量关系的回归方程式,算出了r,在做结论之前应先作统计检验,若P>0.05,则此回归方程并无实际意义。
8. 等级变量资料误用检验 等级资料(如治愈、显效、好转、无效),要比较疗效只能用非参数检验(秩和检验或Ridit分析),常见错误是采用检验。R×C行列表的检验只能区分两组构成比差异,四格表的检验忽视了等级信息。
9. 参数检验和非参数检验混淆 计数资料最常用的统计方法为χ2检验或U检验,计量资料的统计数据经常用t检验或F检验,但也经常出现参数检验代替非参数检验进行处理。如微量元素(血铅、血锌、尿汞)等数据经常出现偏态分布。当数据呈偏态分布时,小样本(n<50)不能用参数统计方法(t检验或F检验),而应该用非参数统计方法(参比差值法或秩和检验),或进行数据转换(倒数或对数)后用参数统计方法。
10. 重复测量设计资料出错 如为了解造模前后大鼠体重间是否有差别,选用36只大鼠随机分为3组,每组12只,第1组为对照组,第2组为低剂量组,第3组为高剂量组,分别在给药前、给药后1、2……8周测量大鼠体重,误用t检验分析。宜用方差分析,并且还要对组内因素及组间因素分别进行检验,对各重复测量时间的变化趋势进行分析,观察检验结果有无统计学意义。其实重复测量方差分析模型应用非常广泛,只是临床医生用得较少不太熟悉罢了。