spss新手入门2

来源:百度文库 编辑:神马文学网 时间:2024/04/28 22:40:31
随着速度越来越快,计算机的功能越来越多,计算统计功能反而已经成为了计算机的一个次要部分.不过,对于我们这些从事社会学学习和研究的人来说,快速的计算和统计仍旧是我们使用计算机的主要功能,所以我们平日的工作总是离不开SPSS(Statistical Package for the SocialScience社会科学统计软件).SPSS虽然好用,但是学起来并不容易,特别是在目前高校的教育体制下,教材的过时以及课程设置的不合理,使得SPSS的学习成为了社会学,统计学以及其他社会科学学科学生极为头痛的一件事情.更为棘手的是:往往在学生还没有学会SPSS之前,一些调查研究任务却又强迫他们使用SPSS进行分析工作,使得他们十分苦恼.
本教程就是为那些已经学习过统计学,并且粗通计算机,但尚未学习过SPSS的社会科学学科的学生准备的,运用面向问题的教学方法,通过一个调查问卷的具体分析过程使学生们对SPSS有一个感性认识,并能够再没有完全掌握SPSS的前提下利用SPSS完成一些分析任务.因此,本文不强调面面俱到,只强调读者能够完成调查分析的任务,所以会故意忽略SPSS一些十分重要但未必会用到的功能,还请读者见谅.如果读者确实需要使用这些功能,建议参考一本好一点的辅导书.
相信大家知道:依次完整的利用计算机辅助的问卷调查包括问卷设计,问卷访问,数据输入,数据分析,数据输出,调查报告的撰写六大部分.SPSS软件参与的主要是数据输入,数据分析和数据输出这三个部分.接着,本文就将分成这三块,分别介绍SPSS的使用以及一些技巧,经验.
数据输入
在完成了问卷访问这个部分之后,我们手中便拥有了数百至上万份调查问卷,这些问卷计算机是无法直接识别处理的,我们必须将它们进行适当的编码.由于采用计算机分析,问卷在设计阶段就应该考虑到今后的编码问题,所以应该将问卷设计地以客观题为主,被访问者填写的应该只是注入数字,选项这些计算机能够处理的信息.我们首先要为问卷的每一个填写项都起一个代号,并决定它的数据属性(主要是区分为字符串,逻辑串还是数字).笔者的习惯是首先用英文字母表示填写项的大题号,接着用阿拉伯数字表示填写项的小题号,然后再用英文字母表示填写项是本小题的第几项,最后再加上表示数据属性的后缀,比如说第二大题第三小题的第四个字符串填写项的代号便为B3D_S.在以后的所有分析过程中便利用这个代号来表示数据的具体内容.
接下来,便是具体的输入过程了.首先,我们要对SPSS的数据文件有一个大致的了解,这对以后的学习十分关键.打开SPSS之后,我们便会看到一个类似EXCEL电子表格的东西,但如果你因此便把SPSS的数据文件理解为是类似于EXCEL的东西那么就错了,虽然SPSS数据的表现形式酷似EXCEL,但就实质而言它更接近于一个数据库文件,每一个数据列都有它的列名称(也就是我们刚刚起的代号),列属性(也就是刚刚我们决定的数据属性),这些都类似于数据库中的字段名称,字段属性,如果读者以前学习过数据库的相关知识,那里理解起来就十分简单了.
由于数据繁多,所以我们的输入过程往往不是由本人进行,而是请专业的数据录入人员代劳,而那些人员往往是不会使用SPSS的,所以我们在实际使用过程中数据往往不是在SPSS中输入的,而是在其它软件输入完毕之后利用SPSS导入的.
在这里,导入用的文件格式是十分重要的.也许大家会习惯性的去选择使用EXCEL来录入数据,因为EXCEL与SPSS比较像.但是在笔者的实际使用过程中发现,最好的文件格式不是EXCEL的XLS文件,而是XBASE系列的DBF文件.之所以作这样的选择理由有两个:第一,DBF文件的字段名,字段属性这些在SPSS导入过程中都会被直接利用,可以略去了SPSS之后的列名称,列属性设定工作.第二,EXCEL的XLS文件的具体格式并没有向公众公开,所以在实际使用中XLS文件中的中文信息时常会发生丢失的现象.
在利用XBASE输入完文件之后,我们只需要调用SPSS的菜单FILE下的OPEN功能,选择DBASE数据格式打开文件,然后再另存为SPSS的SAV格式便完成了数据输入过程.接下来我们便要进入最为重要的数据分析这个阶段了.
数据分析
对于外行人来说.SPSS最为难学的部分便是它Analyze菜单下十多项子菜单以及这之下四五十项孙菜单的统计功能,每一项统计功能的用法和功能对于外行人来说就像是天书一般.但是对于学习过统计学的读者来说,这应该不是问题.再加上SPSS在操作的简易性上还是十分优秀的,每一项统计功能一般只需要在窗口下选择统计用的变量,然后设置一下必要的选项,最后按下OK便可以了.所以在这里,具体的操作就不再介绍了.在这里,笔者觉得有必要先介绍一下SPSS的Viewer.在下面的数据分析和数据输出过程中,我们调用SPSS的数据分析和制图模块所得到的结果都会由SPSS自动输出到一个名为Viewer的程序中,并且可以以SPO为后缀名保存成为专门的文件.这样做的好处是如果你的分析和制图工作一次没有完成,那么利用保存的SPO文件,就不必下一次重新作过了.同时,将所有的分析和制图的结果都保存在一个SPO文件中,并随调查报告作为电子附件一起陈送给客户,一来有利于客户检验分析的可靠性,二来也适合于今后电子化,网络化的趋势.
根据笔者的经验,SPSS的学习者在这一阶段最主要的问题在于以往学习的统计指标总是中文的,而SPSS中的统计指标是英文的,指标的中文和英文往往无法一一对应,因此,在这一部分中,笔者主要是附上一张统计指标的中英文对照表,如下:
Summarize菜单项
数值分析过程
……Frequencies子菜单项
单变量的频数分布统计
……Descriptives子菜单项
单变量的描述统计
……Explore子菜单项
指定变量的综合描述统计
……Crosstabs子菜单项
双变量或多变量的各水平组合的频数分布统计
Compare Mean菜单项
均值比较分析过程
……Means子菜单项
单变量的综合描述统计
……Independent Sample T test子菜单项
独立样本的T检验
……Paired Sample T test子菜单项
配对样本的T检验
……One-Way ANOVA子菜单项
一维方差分析(单变量方差分析)
ANOVA Models菜单项
多元方差分析过程
……Simple Factorial子菜单项
因子设计的方差分析
……General Factorial子菜单项
一般方差分析
……Multivariate子菜单项
双因变量或多因变量的方差分析
……Repeated Factorial子菜单项
因变量均值校验
Correlate菜单项
相关分析
……Bivariate子菜单项
Pearson积矩相关矩阵和Kendall,Spearman非参数相关分析
……Partial子菜单项
双变量相关分析
……Distance子菜单项
相似性,非相似性分析
Regression菜单项
回归分析
……Liner子菜单项
线性回归分析
……Logistic子菜单项
二分变量回归分析(逻辑回归分析)
……Probit子菜单项
概率分析
……Nonlinear子菜单项
非线性回归分析
……Weight Estimation子菜单项
不同权数的线性回归分析
……2-stage Least Squares子菜单项
二阶最小平方回归分析
Loglinear菜单项
对数线性回归分析
……General子菜单项
一般对数线性回归分析
……Hierarchical子菜单项
多维交叉变量对数回归分析
……Logit子菜单项
单因变量多自变量回归分析
Classify菜单项
聚类和判别分析
……K-means Cluster子菜单项
指定分类数聚类分析
……Hierarchical Cluster子菜单项
未知分类数聚类分析
……Discriminent子菜单项
聚类判别函数分析
Data Reduction菜单项
降维,简化数据过程
……Factor子菜单项
因子分析
……Correspondence Analysis子菜单项
对应表(交叉表)分析
……Homogeneity Analysis子菜单项
多重对应分析
……Nonlinear Components子菜单项
非线性成分分析
……OVERALS子菜单项
非线性典则相关分析
Scale菜单项
……Reliability Ananlysis子菜单项
加性等级的项目分析
……Multidimensional Scaling子菜单项
多维等级分析
Nonparametric Tests菜单项
……Chi-Square子菜单项
相对比例假设检验
……Binomial子菜单项
特定时间发生概率检验
……Run子菜单项
随即序列检验
……1-Sample Kolmogorov Smirnov子菜单项
样本分布检验
……2-Independent Samples子菜单项
双不相关组分布分析
……K Independent Samples子菜单项
多不相关组分布分析
……2 Related Samples子菜单项
双相关变量分布分析
……McNemar‘ test子菜单项
相关样本比例变化分析
……K Related Samples子菜单项
相关变量分布分析
……Cocharn‘s Q test子菜单项
二分变量均数检验
……Kendall‘s W子菜单项
一致性判定
Time Series菜单项
……Exponential Smoothing子菜单项
平衡序列的随机分量
……Curve Estimation子菜单项
数据拟合
……Autoregression子菜单项
一阶自回归误差线性方差检验
……ARIMA子菜单项
综合自回归移动平均分析
……XII ARIMA子菜单项
增倍和加性季节因子分析
……Seasonal Decomposition子菜单项
对时间序列增倍和加性季节因子分析
Survival菜单项
……Life Tables
生命表分析
……Kaplan-Meier
双事件分布检验
……Cox Regression
事件与时间变量相互分析
……Cox w/Time Deep COV
时间函数Cox分析
有了这一张表,相信读者便可以很容易的利用SPSS进行各类分析了.实际上,数据分析这一阶段,就使用SPSS上没有什么难度,关键是在于究竟你能够怎样最好的利用SPSS提供的分析模块从数据中挖掘出更多的东西来,这可就要依靠你的不断摸索了.最后,还要介绍一个小技巧:
如果读者所在学校今后学习的SPSS软件为DOS版本的话,那么今后你就必须利用命令行来驾驭SPSS,所以你在利用SPSS的Windows版本进行数据分析的过程中,可以利用每一项统计功能窗口OK按钮下的Paster按钮将本统计功能的命令行复制到剪贴板,然后再仔细研究.
数据输出
经过数据分析,我们已经得到了很多有用的结果了.但是单单是这样是不够的,只有我们将结果撰写成调查报考,才能为人所接受.所以,就很有必要由SPSS输出必要的结果来.
首先便是制图,数字很简洁很精确,但是不够直观,不利于读者更好更迅速的理解调查报考,所以我们应该将数据转化成直观的图形.SPSS的制图能力是极其强大的,能够输出的图形包括条形图,面积图,圆图,高-低-收盘图,极差图,距限图,排列图,帕累托图,工序控制图,误差条图,散点图,直方图,时间序列图,相关图等几十种.
虽然SPSS能够绘制的图形很多,但并没有增加我们的学习难度.事实上,大多数图形绘制需要设置的东西是大同小异的,这里就以最简单的条形图为例进行介绍.
点击菜单中的Graph,然后选择Bar,便会弹出一个窗口让你选择条形图的图式,由简单条形图,分组条形图,分段条形图,根据你的需要,选择一个.然后按下"Define",接着我们选择需要制图的字段,在条形图中只能选择一个字段,其他的图形根据图形本身的特性会有所不同.选择完字段,我们需要设置坐标轴,是按照百分比还是数字或其他方式绘制坐标轴.最后可以利用"Title"按钮设置图形的标题,最后按下"OK",在SPSS的Viewer中便会得到我们需要的图形了.按照以上介绍的方法,将所有需要的图形全部制作完毕,我们便要开始将图形和分析结果正式输出到调查报考中去了.一般来说,我们会使用诸如WORD,WPS2000这类字处理软件来撰写调查报告,由于WINDOWS的剪贴板帮忙,我们只需要简单的利用"复制","粘贴"便可以完成输出了.
值的一提的是,SPSS在输出上为我们考虑的十分周到,可以选择以图片或RTF格式输出.如果你希望将分析结果和图形以图片格式输出,那么选择你需要输出的结果或图形,然后按下鼠标右键,在弹出的菜单中选择"CopyObjects".如果你希望将分析结果和图形以RTF格式输出以便于在字处理软件中进行进一步的编辑,那么在刚才弹出的菜单中选择"Copy"便可以了.
至于这两种方法孰优孰劣,就必须是具体情况而定了.以图片输出的方式虽然牺牲了进一步处理的便利性,但是由于SPSS软件本身便已经具有了一定的标准性,所以它输出的分析结果和图形自然具有一定的权威性;而以RTF格式输出的方式,我们可以将分析结果以及图形中的英文信息替换为中文,并进行必要的增删以增加可读性.如果调查报告的委托人并不熟悉英语或并不是社会学,统计学的专业人士,那么这样的操作就极其有必要了.
来源:http://bbs.sachina.edu.cn/viewthread.php?tid=3177&extra=page%3D2