远程教育研究中的数据分析与SPSS的运用上

来源:百度文库 编辑:神马文学网 时间:2024/04/26 23:54:28
一、介绍
无论是质的研究,还是量的研究,对研究获取的资料
进行分析都是不可缺少的一环。质的研究收集的是定性
资料,量的研究收集的资料主要是量化数据。尽管所有数
据分析的基本目的都是相同的,但是,定性资料与量化数
据的分析方法却很不相同。对定性资料的分析是进行逻
辑归纳,是一个对观察记录所得资料进行逻辑分析的思
考过程;对量化数据则是采用数学方法,进行统计分析,
以统计术语呈现分析结果
我们可以将计算全部交给计算机代劳,稍许等待,计算机就会按你的指
令输出结果。目前,电脑在教育、社会科学研究中的应用
仍在呈不断扩大之势。例如,利用计算机网络对学习者网
上学习动态进行跟踪和统计,可以研究学习者学习行为、
特征。也可以动态统计网上学习材料使用情况,实时了解
学生对学习材料的选择倾向等等,这样,远程教育研究的
实效性将得到很大提高。
量化数据分析在远程教育研究中占有十分重要的地
位,无论是采用问卷调查,还是实验研究,收集到大量的
数据看起来可能杂乱无章,若不掌握相应的数据统计分
析技术,就很难对其总体做出评价判断,也就难以得出科
学的结论,在某种意义上说,数据统计水平直接影响量的
研究水平由于不少远程教育实践者和研究者对数据定
量分析技术缺乏足够了解,在研究设计和数据分析时,往
往只是考虑平均值、百分比等,难以对研究资料进行深度
挖掘,严重制约着远程教育研究的开展和研究水平的提
高,进而影响我国远程教育的实践。
在定量研究中,计算机具有非常重要的作用,就好比
显微镜之于生物学,望远镜之于天文学一样。计算机技术
的普及,特别是一些统计软件,如SPSS,SAS的不断完善,
使数据统计分析不再让人望而生畏,枯燥、繁琐的数据计
二、数据统计的类型
量化数据统计分析的主要用处是:描述数据中什么
是典型的,什么不是;显示两个或多个变量间的差异和相
关;确定样本中得出的结果不是由于偶然因素造成的,而
确实是反映了总体情况的可能性。
为了进行量的研究设计和数据统计,我们需要了解
数据统计的类型,然后学习具体的统计技术。统计学
( Statistics)是描述、组织、综合、分析、以及解释量的资料
的方法或程序。通过统计处理可以将个别观察而得的数
据,整合成为团体的特征,形成原理、原则。数据统计技术
分为描述统计(Descriptive Statistics)和推论统计(Inferential
Statistics)两类。
(一)描述统计
描述统计方法是将搜集来的大量资料数据,加以整
理、归纳和分组,简缩成易于处理和便于理解的形式,并
计算所得数据的各种统计量,如平均数、标准差、以及描
述有关事物或现象的分布情况、波动范围和相关程度等,
以揭示其特点和规律。
描述统计至少具有以下特点:将资料转化为可统计
的数据,并呈现数据的分布、分类、图表;就事论事,不做
推论;描述统计是数据分析的基本形式,是解释量的研究
结果不可或缺的;描述统计也有其局限性,由描述统计获
得的结果只能解释说观察到的样本(团体)本身,不能推
论到其他团体。
(二)推论统计
推论统计是通过分析总体中部分样本的数据,达到
推测或预测总体性质的目的。由于许多研究问题,需要从
样本中获取的数据来预估总体的特征,因此,在这类研究
中常采用推论统计。推论统计至少具有以下特点:目的是
了解总体性质;已知推论未知,由部分推论到全体、或者
说由样本推论到总体。
三、如何将资料转换成计算机能处理的格式
无论是描述统计,还是推论统计,为了让电脑施展它
神奇的魔力,首先得让它读懂你所搜集的资料,而从不同
提问方式得到的资料,数据性质可能不同,因此,你可能
需要将所搜集的资料转换为统计软件能够读取和分析的
形式。将受访者的回答进行转换,以便电脑能够读懂的过
程就是“编码”。
(一)测量的量尺类型与编码
搜集数据的一个步骤是测量(measurement ),通过测
量,将观察转化为数值,量化的数值用于计算机处理。测
量的量尺分为类别量尺、顺序量尺、等距量尺和等比量尺
四种类型。量尺性质不同,统计分析力一法上也有不同。
I.类别量尺(nominal scale ):例如,将注册学生的学
历分为高中、专科、本科、硕士四类;将远程学习者就业状
况分为全职工作、临时工作和无工作等。类别量尺表示的
数字不可进行加、减、乘、除运算。
类别量尺分为二分量尺、三分量尺和多分量尺。二分
量尺又分为真正二分量尺和人为二分量尺。真正二分量尺
如性别分为“男和女”,学习状况分为“在学和退学”,婚
姻状况分为“已婚和未婚”等等;人为二分量尺是将连续
自变量以人为方式分成二类,例如,将智力高低分为“智
能正常和智能不足”,成绩高低分为“合格和不合格”。
2.顺序量尺(ordinal scale ):用以表示测量对象之间
的相对位置,相邻各等级间间隔不等。顺序量尺不能标示
对象之间的距离。最常用的是来克特(Liken)的等级法,
如,将学生身高分为5个等级,将辅导教师对某种教学活
动的态度分为“非常同意、同意、中立、不同意、非常不同
意”5个等级等。
3.等距量尺(interval scale ):相邻各等级间的间隔相
等,但没有绝对零。例如,将学生年龄或者成绩分成若干
相等距离的若干段。
4.等比量尺(ratio scale ):测量的结果以比例或百分
比表示,既有相对单位又有绝对零,具有可加性、可乘性。
例如,学习者用于上网学习时间占每周学习时间的比例
分为1/2, 1/3,1/4,1/5等。
在使用SPSS进行数据分析中,需要定义变量的数据
性质是属于类别、顺序、还是等距、等比量尺,见图la
图1 SPSS数据编挥窗口中的变1毅据性质定又
(二)编码方法
以上量尺在远程教育研究中经常用到,有些量尺获
取的数据电脑可以读懂,直接录人SPSS的数据表格中就
可以了,有些则不能。有的问题编码很容易,如受访者的
性别、学历、就业状况、所学专业等等,只需赋以不同的数
值即可,有的则需要根据研究的需要进行斟酌。
以下是一项调查远程辅导教师的两个问卷题目,很
显然,对问题的很多回答电脑是不能直接读懂的。
例1,只要具备必要的软硬件条件,您会根据教学的
需要,在辅导活动中运用信息工具吗?
A.肯定会B.会
C.中立D.不会E.肯定不会
例2,您认为将信息技术应用于远程辅导的主要障碍
是(可多选题):
A.工作任务繁重,时间和精力不够
B.信息技术对教学的实质性帮助不大
C.学校可用于教学的计算机、网络等设施不足
D.学校缺少合适的课件和资料
E.不知道如何找到合适的课件和资料
F.不善于将教学意图用计算机来实现
G,不会排除使用过程中遇到的软硬件故障
H.其他
例I所示的问卷形式我们经常用到,通常这种问卷的
答案属于顺序资料,即数据表现为次序性,“非常同意”
反映出比“同意”更高层次的认同,“肯定会”比“会”反
映出更高层次的认同。如果你分别把数值‘`5,4,3,2,1"
分别编给5个答案选项,很明显,这就是按顺序量尺进行
编码了。
但是,在判别资料数值量尺时,我们经常要面对答案
是属于顺序特性,还是差距特性的问题。实际上,对于问
卷的答案是“非常同意、同意、中立、不同意和非常不同
意”,或者“肯定会、会、中立、不会、肯定不会”,有时可定
义为顺序量尺,有时可根据研究的需要定义为等距量尺,
即把这些资料视为等距资料。如果受访者就20句相关的
句子或问题表示其同意程度,我们可以视这些评价为等
距量尺,把受访者对问题所圈选的数值相加,以作进一步
的资料分析。
例2所示的多选母项目如何编码呢?这样的间题的确
让不少人措手无策,或改用手工统计。实际上,SPSS的
"Multiple response‘’分析功能能很好地解决这一间题。你
可以将每一个回答作为一个变量,回答“是”的定义为
..1 n,回答“否”定义为“0’’,并将数据输入SPSS的“数据
编辑窗口”,见图2,然后,使用‘`Multiple iesponse‘’分析功
能,得出统计数据。
以SPSS为例,数据编辑窗口(SPSS Data Editor)就是
数据输人的表格,SPSS的数据编辑窗口又有数据界面(图
3)和变量界面(图4),数据界面和变金界面的菜单是一
致的。在数据界面,横向的每一栏是变量,纵向表示的是
样本(例如.调查的受访者,即本例中的每位受访的教师,
对应的是SPSS的一个Case )。你可以指定相应的变量名
(如图3中的“教龄”、“年龄”等),并输入每个样本对应
的数据〔见图3)。
图3 SPSS窗口的Data View界面
图2多选趁的偏玛及在SYSS数拓编样窗口中呈现的位
此外,虽然编码方案必须配合研究的特别需要,但其
中有一个总的原则是:尽量把资料分得很细。一旦不再需
要这么细的分类时,我们仍然可以把这些资料进行重新
的归并(这一点SPSS很容易做到),也许一种新的合并会
带来新的发现。但若资料一开始便被粗略地编人少数的
类别中,那么,分析时有很多细节性的信息将因此而完全
丧失。例如,接受远程培训的教师所执教的年级,是让受
访者直接填写执教年级的数值好呢,还是分为“小学”和
“中学”两个选项让受访者圈选好呢?再如,学生的工龄,
是分成若干等级让受访者圈选呢,还是让受访者直接填
写数值呢?
作者2002年对电大学生的调查中.统计发现三种视
听材料中,电视直播课的利用率最高,其次是VCD教材,录
像教材的利用率最低。是不是所有专业的学生都倾向于
选用电视直播课呢?后来,将学生总体分四个专业统计,.
结果发现,不同专业学生对三种视听材料的选择倾向不
同,小学教育专业学生倾向选用的视听媒体是VCD,“愿
意和非常愿意”选用的占64.39‘0,而非电视直播课。细分的
结果是将原来淹没的信息呈现出来了,获得新的发现,如
果当初没有将对专业作细致的划分,就不可能有这一新
的发现。总之,建议你在设计问卷或编码过程中,最好将
资料分得详细一点。
四、数据的抽人与整理
编码解决了计算机识别数据的问题,为进行统计分
析,接下来要做的是将数据输人计算机,并对翰人的数据
进行整理。不同的电脑程序有不同的资料建构方式。在大
多数的情况下,你可以直接使用分析程序来输人资料,如
果数据量大,可以考虑用读卡机输人数据。
图4数据编挥窗口的Variable View界面
SPSS的数据编辑窗口。功能:对SPSS的数据进行定
义、录人、修改、管理等基本操作的窗口;组成:窗口主菜单
( Data,Transform,Analyze,Graphs )、工具栏、数据编辑区、
状态显示区;SPSS运行过程中自动打开,且只能打开一个
窗口,运行过程中无法关闭;SPSS中各统计分析功能都是
针对该窗口中的数据进行的,本窗口中的数据以.,文件
格式存盘。
此外,你也可以用其他的方式来创建自己的资料文
件(例如,Excel),然后再将资料导入SPSS分析程序中。在
其它的资料分析程序中,也都有相似的方法可供选择。
(二)数据的整理
不论人工输人数据,还是机器读人数据,下一个重要
步骤就是要清除资料中的错误,也就是资料的“净化”。
因为,人工输人数据时,不管你如何小心冀翼,错误总是
难免的;如果是读卡机读入数据,可能发生的错误包括编
码错误、读错编码、感应错误等等。以下的两种资料整理
步骤是必须完成的,一种是可能编码整理.另一种是列联
式整理。
1.可能编码整理
任何变量都有一组特殊的属性,而这些属性可以被
转换成一组对应的编码。例如,在性别变量中,只有三个
可能的编码:1.男性,2.女性,3.无答案。如果在某个样本中
改变量的编码为‘`5”的话,则很明显就是一个错误。
可能编码是整理方法有两种。第一种,如我们前面所
看到的,电脑资料输人时检查是否有错误发生。例如,如
果你在性别项目输人‘`5",电脑便会“哗哗”地叫,并拒
绝输人这一错误号码,而不是在资料输人以后再进行检
查。如果你没有这些电脑程序的话,可以利用每个项目答
案的频次分布来达到可能编码式整理的效果。例如,在你
的资料中,有sso个人在性别一项的编码为“1"(女性),
630个人为“2"(男性),1个人为‘`5",那么你就会怀疑
"5”这个是个错误。一旦发现错误,接下来就要找到相应
的文件(如问卷),查出到底错误出现在哪里,然后作必
要的更正。
2.列联式整理
列联式整理较为复杂。由于资料本身的逻辑结构会
给某些受访者的回答造成限制,因此很容易发生资料的
误读而导致错误。例如,如果问卷中的题目是问受访者每
周平均上网学习多少小时,所有“上网学习的受访者”的
回答都该有个代码,而“从不上网学习的受访者”则不会
有任何回答记录(或用某一特别码指明该题不适用),假
使某位“从不上网学习的受访者”的答案代码显示为
+3?,表示他“每周平均上网学习6-12小时”,这样的错
误若不纠正,其统计结果将十分滑稽。
虽然资料的整理是资料处理的过程中一个基本的步
骤,但是在某些特定的情况下,你可以安全跳过而不用做
这项工作。也许你觉得可以剔除在某个项目上出错的少
数几个样本,而不会出现任何问题,但这种情况只有在你
排除这些样本,且研究结果并不会因那次错误而受到任
何显著影响才行得通。假如一些男士在问卷上圈选了“生
过小孩”,那么在这个变量上,你可以只限于分析女性的
答卷,而把男性的排除在外。不过,你并不能以这些原因
在为借口来掩饰一个很糟糕的研究。记住,“烂”资料永
远只会误导研究的结论。
(资料来源:C.M.C1url。著,张莉莉张学丈子译,教育研究导论,2003)
选择何种数据分析方法,要由研究的目标和数据的
性质决定。如果你对你的研究目标和数据的性质十分明
了,刀a么,选择何种数据分析方法就是一件很容易的事
了,你可以很方便地在SPSS的Analyze菜单选择相应的分
析程序(图5)。
有时候,同一项研究中既有定性资料的分析,又有量
化数据的处理。在选择统计分析方法时,应先仔细考虑数
据的种类、使用的研究设计或统计检验的假设,这有助你
选取最合适的统计分析去处理所收集的数据资料。
本文按照数据分析的先后顺序,结合远程教育研究
中可能遇到的问题,初步介绍了如何将资料转换成计算
机能处理的格式,如何将数据输入SPSS的数据表格,如何
进行数据整理和“净化”,以及如何按数据的性质和研究
设计去选择合适的统计分析技术,希望能对你的研究有
所帮助。如果你对教育统计和SPSS缺乏了解,还应参考有
关书籍。
五、如何选择数据分析方法
整理资料后,研究者便可以准备分析数据了。一般而
言,研究的假设决定研究的设计,研究设计决定统计分析
方法,数据分析的性质与研究的类型密切关联,见表20
表2各类研究最常用到的数据分析的类型
远程教育研究中的数据分析与SPSS的运用上 远程教育研究中的数据分析与SPSS的运用下 荣泰生《SPSS与研究方法》配套PPT 实验研究列联表资料的SPSS分析--《中国热带医学》--医学期刊频道--首席医学网 MACD的分析与运用 与远程教育学习者文化相关研究的文献目录 美国远程教育政策和原则的分析与启示 SPSS与测验信度、效度、及项目分析 重温远程教育研究方法(上) 药火术语的分析与运用 关于与之间的关系与区别 - 资源共享区 - SPSS下载,spss视频,Amo... 未来数据在实战中的运用 未来数据在实战中的运用★ 未来数据在实战中的运用 远程网络教学的网站建设与研究-远程教育,高校,研究-教育行业-hc360慧聪网 国际远程教育研究的现状与挑战——专访国际远程教育著名专家迈克尔·穆尔博士 国际远程教育研究的现状与挑战——专访国际远程教育著名专家迈克尔·穆尔博士 中外远程教育发展历史分析与比较* 看《基于设计的研究范式在网络三维虚拟实验中的运用研究》有感 益生菌在中国的研究运用与市场发展前景 清胃散的运用思路与方法 - 各科研究 王付经方 失笑散的运用思路与方法 - 各科研究 - 王付经方 Excel函数大全 - 日志 - xsmile- 数据挖掘学习交流论坛 数据挖掘,数据分析,CRM,Data Mining,Data analysis,SPSS,SAS,excel VBA - Powered by Discuz! 网络课程中学习支持的研究与实践 - 远程教育 - 中国教育技术学科网