医学论文审稿中应用统计学审查的必要性-统计结果描述缺陷此种情况12篇中,描述为增高或明显增高、差异有显著性或极显著性9篇(75·0% ),描述为具有显著相关性(正确为两因素具有关联关系
1 统计学审查分析
1.1 总体情况
200篇医学硕士论文中,统计图表制作规范、合理,统计描述指标选择基本符合数据特点,统计推断方法选择基本符合设计要求及数据特点,未发现明显统计学问题的共16篇 (8.0% );或多或少存在各种统计学问题共184篇(92.0% )。其中,实验设计存在问题68篇(37.0% );统计学描述及统计推断方法选择不当或错误共176篇(96.7% );统计结果描述缺陷12篇(6.5% );图表存在问题72篇(36.0% )。由此可见,统计学描述及统计推断方法选择不当或错误最为常见, 其次为图表和实验设计问题。
1.2 实验设计
存在实验设计问题的68篇中,主要以分组后未检验其可比性、未说明样本量估算依据最为突出,其次为样本量不足、未交代样本量及研究对象背景资料不全或缺失等(表1)。表1 医学论文实验设计存在的问题存在的问题 篇数(% ) 分组后未检验其可比性15(22.1) 未说明样本量估算依据14(20.6) 样本量不足11(16.2) 未交代样本量10(14.7) 研究对象背景资料不全或缺失8(11.8) 未交代分组设计情况3(4.4) 总例数与分组后例数不符2(2.9) 分组不随机2(2.9) 样本缺乏代表性1(1.5) 样本缺失1(1.5) 缺少失访例数1(1.5) 合计68(100)
1.3 统计方法描述及选择
存在统计学描述及统计推断方法选择不当或错误的172 篇中,统计学描述存在问题130篇(75.6% ),统计推断方法选择不当或错误86篇(50.0% ),同时存在以上两个问题的 44篇(25.6% )。
1.3.1 统计学描述存在问题
共130篇存在此类情况,尤以方差分析或t检验时未说明数据是否服从正态分布及(或)方差齐性最为突出中国科技期刊研究, 2011, 22(4)46.9% ),其他依次为无统计方法描述、未交代方差分析后多重比较方法、描述不规范、未给出统计学检验水准、统计符号不规范等(表2)。表2 医学论文统计学描述存在的问题存在的问题篇数(% ) 方差分析或t检验时未说明数据是否服从正态分布及(或)方差齐性61(46.9) 无统计方法描述29(22.3) 未交代方差分析后多重比较方法25(19.2) 描述不规范①23(17.7) 未给出统计学检验水准22(16.9) 统计符号不规范14(10.8) 满足正态分布的数据采用-x±SEM表示4(3.1) 数据表示与检验方法不符②3(2.3) 描述不细致或不规范③3(2.3) 非参数方法未给出相应条件检验的结果2(1.5) 相关分析未说明采用何种方法及相关系数、是否做过正态性检验2(1.5) 存在上述2项及以上问题45(34.6) ①统计方法中,习惯上先介绍所使用的软件,然后是描述性分析和统计推断等。②如x±s用秩和检验。③如非配对t检验应改为独立样本t检验;秩和检验中T检验,应写明具体的检验方法; “spearman相关”应改成“spearman秩相关”;“TAMs采用t检验”宜改为“TAMs组间比较采用LSD法或SNK法”等.
1.3.2统计推断方法选择错误
此类情况共86篇,主要为多组间比较采用t检验而不是方差分析、重复测量数据组间比较采用t检验而不是重复测量方差分析、应采用重复测量方差分析而用单因素方差分析;其次为方差分析的两两比较采用t检验而不是LSD或 SNK、未满足正态分布的资料(标准差较大)采用t检验或方差分析、等级资料采用χ2检验、未具体交代哪种方差分析方法、应采用Fisher精确概率法而采用四格表或χ2检验、方差分析时直接进行两两比较而未先行多组间总体比较、应采用多因素方差分析而用单因素方差分析等(表3)。
1.4 统计结果描述缺陷
此种情况12篇中,描述为增高或明显增高、差异有显著性或极显著性9篇(75.0% ),描述为具有显著相关性(正确为两因素具有关联关系)、相关分析时仅标出P值而无相关系数或列联系数、未给出统计量值各1篇(各占8.3% )。
1.5 图表存在问题
此类情况有72篇,其中表存在问题61篇(84.7% ),图存在问题15篇(20.8% ),图表均存在问题4篇(5.6% )。表3 医学论文统计推断方法选择错误统计推断方法选择错误篇数(% ) 多组间比较采用t检验而不是方差分析18(20.9) 重复测量数据组间比较采用t检验而不是重复测量方差分析14(16.3) 应采用重复测量方差分析而用单因素方差分析13(15.1) 方差分析的两两比较采用t检验而不是LSD或SNK 7(8.1) 未满足正态分布的资料(标准差较大)采用t检验或方差分析6(8.1) 等级资料采用χ2检验4(4.7) 未具体交代哪种方差分析方法4(4.7) 应采用Fisher精确概率法而采用四格表或χ2检验3(3.5) 方差分析时直接进行两两比较而未先行多组间总体比较3(3.5) 应采用多因素方差分析而用单因素方差分析3(3.5) 应采用析因分析而用单因素方差分析2(2.3) 生存分析时未采用kaplan-Meier进行生存时间的比较而采用χ2 检验比较生存率2(2.3) 采用区组设计或交叉设计分析时采用t检验2(2.3) 不满足独立样本t检验而未进行校正或改用其他方法2(2.3) 应采用多因素方差分析而用析因分析1(1.2) 配对资料采用χ2检验1(1.2) 相关分析用t检验1(1.2) 合计86(100)
1.5.1 表存在的问题
61篇中数据保留的有效位数不一致16篇(26.2% ),未采用三线表12篇(19.7% ),表中未给出样本量、表头不规范各7篇(各占11.5% ),图表内容重复、表中无P值及(或)星号标注各5篇(各占8.2% ),表注注释不全或不当3篇 (4.9% ),未注明统计方法、统计符号不规范各2篇(各占 3.3% ),无表题及表序、未注明数据形式各1篇(各占1.6% )。
1.5.2 图存在的问题 1
5篇中图采用不恰当(如X轴为连续时间变量而采用柱形图;X轴为不同的干预分组,为分类变量而采用线图)4 篇(26.7% ),图纵横坐标未注明计量单位3篇(20.0% ),无图题、图绘制不规范各2篇(各占13.3% ),图注释不全或不当、条形图无数据标签、图题不明晰、图中数据有效位数不一致各1篇(各占6.7% )。