实验研究列联表资料的SPSS分析--《中国热带医学》--医学期刊频道--首席医学网

来源：百度文库编辑：神马文学网时间：2024/04/29 12:01:33

在临床实验研究与基础实验研究中，所分析的指标可以是定量的，也可以是定性的。其定量指标，有时也转化成定性资料进行分析。这些定性资料或由定量资料转化而来的定性资料，一般都整理成列联表形式，根据资料性质和分析目的选择恰当的分析方法进行统计分析，并将统计分析结果与专业知识相结合，做出合理的解释。SPSS（Statistics Package for Social Science），即社会科学统计软件包，是国际上最具权威性的统计分析软件之一，以其具有完好的人机对话操作界面、强大的统计分析功能和运算快速的特点，被广泛应用。本文结合实验研究列联表资料实例，运用SPSS 13.0 for Windows软件包进行统计分析，对操作过程和结果解释予以详细说明，希望能给广大医学科研工作者提供借鉴。
1 一般四格表资料
实验研究一般四格表资料的分析目的主要有2个，一是分析两个率的总体差别有无统计学意义或两样本某指标的分布（或构成）总体是否相同，二是分析两个分类特征是否有关联。
例1 某院欲比较异梨醇口服液（试验组）和氢氯噻嗪＋地塞米松（对照组）降低颅内压的疗效，将200例颅内压增高患者随机分为2组，见表1。
表1 试验组和对照组降低颅内压疗效的比较（略）
数据录入：打开SPSS；点击Variable View定义变量，变量1 Name为“group”，Type为“String”；变量2 Name为“effect”，Type为“String”；变量3 Name为“count”，Type为“Numeric”，Decimals为“0”，其它为默认设置；点击Data View输入数据。
分析过程 ①频数加权（所有列联表资料均需经过频数加权，以下例题分析中省略该过程）：
Data →Weight Cases
Weight Cases by：
Frequency Variable：count
OK
②分析：
Analyze →Descriptive Statistics →Crosstabs
Rows：group
Columns：effect
Statistics：√Chi-square：Continue
OK
主要结果与解释：根据四格表资料χ2检验的应用条件［1］：①总例数（n）≥40且所有的理论值（T）≥5时，选用一般的χ2检验；P≈α时，改用Fisher确切概率法；②n≥40，有1≤T≤5时，选用连续校正的检验；或改用Fisher确切概率法；③n＜40，或T＜1时，用Fisher确切概率法。该资料n大于40，所有T均大于5，可取Pearson χ2值和似然比（Likelihood ratio）χ2值［2］，二者χ2值分别为12.123和12.864，P＜0.01，试验组和对照组的疗效差别有统计学意义，可认为异梨醇口服液降低颅内压的疗效优于氢氯噻嗪＋地塞米松。
例2 一项关于婴儿喂养方式与腹泻关系的研究，资料如表2，试分析腹泻与喂养方式间是否有关联。
表2 婴儿喂养方式与腹泻的关系（略）
数据录入：定义变量，变量1 Name为“method”，变量2 Name为“result”，变量3 Name为“count”，Type均为“Numeric”，Decimals均为“0”，其它为默认设置；输入数据，method：1为“人工喂养”，2为“母乳喂养”；result：1为“有腹泻”，2为“无腹泻”。
分析过程：
Analyze →Descriptive Statistics →Crosstabs
Rows：method
Columns：result
Statistics：√Chi-square，√Contingency coefficient，Continue
OK
主要结果与解释：这里，n＞40，且所有T＞5，取Pearson χ2检验结果，χ2＝9.981，P＜0.01，可认为婴儿腹泻与喂养方式有关联；Pearson列联系数C＝0.329，根据C≥0.7为高度关联、C≥0.4为中度关联、C＜0.4为低度关联的判断原则［3］，二者关联强度较弱。
2 配对四格表资料
例3 某研究者对同一批标本进行两个指标的检测，结果见表3。问：①两个指标的分布有无差别？②两个指标有无关联？
表3 同一批标本两个指标的检测结果（略）
数据录入：定义变量，变量1 Name为“A”，变量2 Name为“B”，变量3 Name为“count”，Type均为“Numeric”，Decimals均为“0”，其它为默认设置；输入数据，A＝1、B＝1：甲指标“＋”、乙指标“＋”；A＝1、B＝2：甲指标“＋”、乙指标“－”；A＝2、B＝1：甲指标“－”、乙指标“＋”；A＝2、B＝2：甲指标“－”、乙指标“－”。
分析过程：
Analyze →Descriptive Statistics →Crosstabs
Rows：A
Columns：B
Statistics：√Chi-square，√ Contingency coefficient，√ McNemar，Continue
OK
主要结果与解释：McNemar χ2检验（SPSS McNemar 检验法不给χ2值），P＝0.185，说明两个指标分布的差别无统计学意义；一般χ2检验，Pearson χ2＝235.821，P＜0.01，说明两个指标存在关联，Pearson列联系数C＝0.592，关联程度中等。
例4 某研究者用胃镜和活检对1 321例患者进行胃癌检查，结果见表4。问胃镜和活检的结果是否一致？
表4 1 321例患者胃镜和活检结果（略）
数据录入：同例3。
分析过程：
Analyze →Descriptive Statistics →Crosstabs
Rows：A
Columns：B
Statistics：√Kappa，√ McNemar，Continue
OK
主要结果与解释：McNemar检验，P＜0.01，说明两种检查方法有差别；Kappa检验（SPSS不给可信区间），Kappa＝0.824，P＜0.01，说明两种检查具有较好的一致性。可以看出，两种检验结果是矛盾的。为什么呢？McNemar法一般用于样本含量n不太大的资料，因只考虑结果不一致的情况，而未考虑样本含量n和结果一致的情况，所以，当n很大且结果一致率高时，不一致的数值相对较小，容易出现有统计学意义的检验结果，但实际意义可能不大［1］。本例即是如此，应以一致性检验结果为准。实际上，对于两种检验（查）方法或诊断方法结果进行分析时，主要分析的也就是一致性。根据Kappa值判断一致性强度的标准尚有争议，一般认为：Kappa值＜0.4时，一致性较差；在0.4～0.75之间有中度至高度一致性；＞0.75时，有极好的一致性［4］。
3 R×C表资料
3.1 双向无序R×C表资料例5 某医生研究物理疗法、药物治疗和外用膏药三种疗法治疗周围性面神经麻痹的疗效，资料见表5，问三种疗法的有效率有无差别？
表5 三种疗法治疗周围性面神经麻痹的疗效（略）
数据录入与分析过程，见例1。
主要结果与解释：该资料的原因变量（疗法）与结果变量（有效与无效）均无序，属双向无序R×C表资料，选用一般χ2检验分析即可。R×C表资料χ2检验时，要求所有T≥1且T＜5的格子数不超过总格子数的1/5，否则：①增加样本含量以增大理论频数；②根据专业知识，删去理论频数太小的行或列，或将理论频数太小的行或列与性质相近的邻行或邻列合并；③改用Fisher确切概率［1］。这里，所有T＞5，取Pearson χ2值或似然比χ2值，χ2＝21.038（或21.559），P＜0.01，认为3种疗法有效率的差别有统计学意义。
例6 测得某地5 801人的ABO血型和MN血型结果，问两种血型系统之间是否有关联？
表6 某地5 801人ABO血型和MN血型分布（略）
数据录入与分析过程，见例2。
主要结果与解释：所有T＞5，χ2＝213.162（或248.143），P＜0.01，认为该地ABO血型和MN血型系统之间有关联。列联系数C＝0.188，关联性很弱。
3.2 单向有序R×C表资料例7 某医生用3种药物治疗某病患者，疗效如表7。问3种药物的疗效有无差别？
表7 3种药物对某病患者的疗效（略）
数据录入：定义变量，变量1 Name为“medicine”，变量2 Name为“result”，变量3 Name为“count”，Type均为“Numeric”，Decimals均为“0”，其它为默认设置；输入数据，medicine：1为“A药”，2为“B药”，3为“C药”；result：1为“治愈”，2为“显效”，3为“好转”，4为“无效”。
分析过程：
Analyze →Nonparametric tests →K Independent Samples
Test Variable List：result
Grouping Variable：medicine
Define Range：Range for Grouping Variable：Minimum：1；Maximum：3；Continue
√Kruskal-Wallis H
OK
主要结果与解释：该资料原因变量“药物种类”属于无序变量，而结果变量“疗效”属于有序变量，可以选用秩和检验、Ridit分析或有序变量的Logistic回归分析，本例选用秩和检验分析。结果，χ2(Hc)＝61.146，P＜0.01，说明3种药物的疗效差别有统计学意义。
3.3 双向有序且属性不同R×C表资料例8 某研究者对不同肥胖程度的高血压患者进行治疗，观察患者血压控制情况，试作分析。
表8 不同肥胖程度高血压患者的血压控制情况（略）
数据录入：定义变量，变量1 Name为“fat”，变量2 Name为“control”，变量3 Name为“count”，Type均为“Numeric”，Decimals均为“0”，其它为默认设置；输入数据，fat：1为“不肥胖”，2为“轻度肥胖”，3为“中/重度肥胖”；result：1为“良好”，2为“尚可”，3为“不良”。
分析过程：
Analyze →Descriptive Statistics →Crosstabs
Rows：fat
Columns：control
Exact：○+Exact：Continue/○+ Monte Carlo：Continue
Statistics：√Chi-square， Continue
OK
Analyze →Correlate →Bivariate
Variables：fat， control
Correlation Coefficients：√Spearman，√Kendall’s tau-b
Test of Significance：○+Tow-tailed
OK
主要结果与解释：该资料原因变量“肥胖程度”和结果变量“血压控制情况”均属有序（等级）变量，但属性不同，可通过χ2检验判断高血压患者的血压控制情况和肥胖度之间有无相关性，并通过等级相关分析其相关程度。该资料有3个格子(33.3%)的理论值均小于5，不能取Pearson χ2检验或似然比χ2检验结果，而应取Fisher确切概率法检验结果，P=0.072＞0.05，故尚不能认为高血压患者的血压控制情况与其肥胖程度有相关关系。Kendall和Spearman等级相关分析结果：τ＝-0.074，P＝0.401;rs＝-0.085，P＝0.381，也不支持两者之间有相关关系。该资料若把“肥胖程度”视为无序的分组变量，则可按照“单向有序R×C表资料”进行秩和检验分析。
3.4 双向有序且属性相同R×C表资料例9 两位放射科医生对一批矽肺胸片独自作出了矽肺分级诊断，请问他们的诊断结果是否一致。
表9 两位医生对一批矽肺胸片的分级诊断结果（略）
数据录入与分析过程，见例4。
主要结果与解释：该资料两位医生的诊断结果有序（等级）且属性相同，选用一致性检验。结果，Kappa＝0.676＜0.75，P＜0.01，认为两位医生的诊断存在一致性，一致性中等。
4 多个样本率间的两两比较
对于K×2表或2×K表资料，总体检验有统计学意义时，只能说明各总体率（分布）之间总的说来有差别，但不能说明任两个总体率（分布）之间有差别。若要对每两个总体率（分布）之间做出有无差别的推断，需进一步分析。
4.1 组间全面比较-Bonferroni法［5］设总的检验水准为α，进行比较的次数为m，令各次比较的检验水准α′＝α/m，并规定P≤α′ 时拒绝H0，基于这样的做法，就可以把Ⅰ类错误的累积概率控制在α。当多组间比较次数不多时，该法的效果较好。但是，当组间比较次数较多（如10次以上）时，检验水准过低，导致结果过于保守，犯Ⅱ类错误的概率增加［6］。
以例5为例，分析三种疗法任两种疗法之间疗效有无差别。
①求总的χ2值，P＜α时，作两两比较。本例Pearson　χ2＝21.038，P＜0.01；
②求各四格表的χ2值及值；
③按公式α′=α k(k-1)／2+1计算校正的α′值，式中k为比较的组数，本例为3；
④各P值与校正的α′值比较，判别有无统计学意义。
表10 三种疗法有效率的两两比较（略）
结果与解释：物理疗法与药物治疗、物理疗法与外用膏药比较，Pearson χ2值分别为6.756和21.323，P值分别为0.009和0.000，均小于调整后的检验水准α′（0.0125），差别有统计学意义，结合物理疗法、药物治疗与外用膏药的有效率分别为96.60％、90.11％和81.94％，可以认为物理疗法的有效率高于药物治疗和外用膏药；药物治疗与外用膏药比较，Pearson χ2＝4.591，P＝0.032＞α′，表明尚不能认为此两种疗法有效率有差别。
4.2 多个实验组与同一对照组比较—Brunden法［7］若多个实验组与同一对照组进行比较时，设总的检验水准为α，样本率个数为k，则每个实验组与对照组比较的检验水准α′，并规定P≤α′时拒绝H0。
仍以例5为例，以外用膏药作为对照，分析物理疗法和药物治疗两种疗法与物理疗法之间疗效有无差别。
①求总的χ2值，P＜α时，作两两比较。本例Pearson　χ2＝21.038，P＜0.01；
②求各实验组与对照组四格表的χ2值及P值；
③按公式α′=α 2（k-1）计算校正的α′值；
④各P值与校正的α′值比较，判别有无统计学意义。
表11 物理疗法和药物治疗与外用膏药法有效率的比较（略）
结果与解释：物理疗法与外用膏药比较，Pearson　χ2＝21.323，P＜α′（0.0125），差别有统计学意义，结合物理疗法与外用膏药的有效率分别为96.60％和81.94％，可以认为物理疗法的有效率高于外用膏药；药物治疗与外用膏药比较，Pearson　χ2＝4.591，P＝0.032＞α′，表明尚不能认为此两种疗法的有效率有差别。
进行多个样本率的多重比较时，除上述介绍的两种方法外，还有将R×C表分割成若干个四格表进行分析的χ2分割法、通过调整检验界值进行多个样本率间两两比较的杜养志法和罗文海法以及通过计算两率之差的可信区间来推断比较组间有无差别的Scheffe法等可供选择［8］。
【参考文献】
［1］孙振球. 医学统计学［M］. 北京：人民卫生出版社，2004，106，113.
［2］方积乾. 卫生统计学［M］.第5版. 北京：人民卫生出版社，2003，119.
［3］程琮，程玮，范华. 行列相关的测度［J］. 中国卫生统计，2003，20(5):313～315.
［4］王建华. 实用医学科研方法［M］. 北京：人民卫生出版社，2003，199.
［5］伍小英，鲁婧婧，张晋昕，等. 两两比较的 Bonferroni法［J］. 循证医学，2006，6(6):361～364.
［6］ Pemeger TV. What’s wrong with Bonferroni adjustments［J］. BMJ, 1998, 316(7139):1236～1238.
［7］郭祖超. 2×k表χ2检验显著时进行两两比较的方法［J］. 中国卫生统计，1986，3(3):52～53.
［8］黄水平. 多个率的多重比较方法的选择［J］. 南京医科大学学报(自然科学版), 2005, 25(12): 962～965.