斯金纳的学习理论

来源:百度文库 编辑:神马文学网 时间:2022/12/09 14:34:38
斯金纳是行为主义的代表人物之一,是操作性条件反射的创始人,是美国当代著名的心理学家。
一、       斯金纳的操作性条件反射学习观
斯金纳根据自己创制的斯金纳箱(Skinner box)对白鼠和鸽子进行实验,提出了操作性条件反射理论。
斯金纳箱是为动物学习实验的自动记录装置。它是一大约0.3米见方的箱子,内有杠杆和与食物储存器相连接的食物盘。在箱内的白鼠按压杠杆,就有一粒食物丸滚入食物盘,便获得食物。一只饿鼠进入箱内,开始时有点胆怯,经过反复探索,迟早会做出按压杠杆的动作,一粒食物丸落入盘内,若干次后,就形成饿鼠按社取得食物的条件反射,斯金纳称此为操作条件反射。
斯金纳认为,学习一定的行为,重要的是要产生后果。如果这一后果容易使这一行为再次发生,这就是一种正强化。如果行为的后果不容易使这一行为再次发生,就是负强化。换句话说,正强化促进某一行为的发生,而负强化使动物避免作出某种行为。人们可以有目的地设计强化程序,使人或动物学会某种行为,或控制某种行为的发生。斯金纳用这种方法研究了鸽子的行为。他曾试图用鸽子建立条件反射,使鸽子能根据颜色用嘴啄动不同的按钮,用这种方法去控制导弹的飞行。
在实验中,斯金纳发现,开始时鸽子啄红,黄和蓝三个按钮是随机的。但是,如果在它啄红色按钮时给它一个正强化剌激(如食物),在它啄黄色按钮时不给予任何剌激,在它啄蓝色按钮时给予负强化剌激(如电击),一段时间之后,鸽子啄取红色按钮的次数明显高于啄取其它两个按钮的次数。
二、斯金纳的强化理论
1.强化物
强化物一般分为两类,一类是指与反应相依随的刺激能增强该反应,此为积极强化物,如水、食物、奖赏等;所谓消极强化物,是指与反应相依随的刺激物从情境中被排除时,可增强该反应。例如,将白鼠放进一特别箱子中,给予白鼠电击直至白鼠按压杠杆。经过几次强化以后,白鼠很快习得了有压反应.以逃避电击。电击即是增强压杆反应的消极强化物,其它诸如强光、噪声、批评等厌恶性刺激皆属此类。
强化还可划分为一级强化和二级强化两类。一级强化满足人和动物的基本生理需要,如食物、水、安全、温暖、性等。二级强化是指任何一个中性刺激如果与一级强化反复联合,它就能获得自身的强化性质。如金钱,对婴儿它不是强化物,但当小孩知道钱能换糖时,它就能对儿童的行为产生效果。再如分数,也是在受到教师的注意后才具有强化性质的。
二级强化可分为社会强化(社会接纳、微笑)、信物(钱、级别、奖品等)和活动(自由地玩、听音乐、旅游等)。
在强化时,可以使用这样一个原则——普雷马克原理(Premack Principle),即用高频的活动作为低频活动的强化物,或者说用学生喜爱的活动去强化学生参与不喜爱的活动。如"你吃完这些青菜,就可以去玩。"如果一个儿童喜爱做航空模型而不喜欢阅读,可以让学生完成一定的阅读之后去做模型,等等。
在实际教育中,人们对各种不同的强化做出反应。有的学生能因在班上受口头表扬而受到激励,但有的学生则不然。一个强化事件本身并不必然有效。因此,在教学中要注意:
(1).教师要针对班上不同的学生提供不同的强化物系列。教师要注意观察和了解学生对什么强化物感兴趣。在一个30多人的班级中,可以事先让学生填写一个问卷。如"在课堂里你喜欢干什么或玩什么东西?在课堂上你最喜爱干的三件事是什么?如果你去商店,你将买哪三件喜爱的玩具?"这些问题还可针对不同的年级加以修改。
(2).教师选择强化物时应考虑年龄因素。有些活动如帮助老师、做谜语题,对小学生可能是更合适的强化物。因此,必须对不同年龄的学生提供相应的有力的强化刺激和事件。
2.条件性强化
所谓条件性强化是指一个中性刺激与一个强化刺激反复匹配联合,那么它也具备了强化的性质,这与赫尔关于次级强化的概念是一致的。例如,在白鼠按压杠杆时,让灯光和食物同时出现,白鼠很快形成条件反应。此后同时撤除灯光和食物,反应迅速消退。此时,在安排白鼠按压杠杆,不给食物而仅呈现灯光,白鼠的压杆反应增加。这表明,灯光已具备了强化性质。许多中性刺激都是由此而获得条件性强化的性质的。
应该指出,条件强化物的强化力量与相匹配的原始强化物的配对次数成正比。如灯光与食物的匹配次数越多,灯光的强化作用便增加。如果某二条件性强化物与许多原始强化物相匹配,那么该条件性强化物便具备了多方面的强化作用而成为一个概括性强化物。最典型的例子莫过于金钱了,但由于它与衣、食、住、行等皆相联系、匹配,因而具有广泛的强化作用。斯金纳进一步指出,概括性强化物即使没有了赖以为基础的原始强化物相依随出现,效果也依然存在。
3.强化的程式
强化的程式是指反应在什么时候多或频繁地受到强化。强化的程式的分类情况如下。
连续式:对每一次或每一阶段的正确反应予以强化。(即时强化)
间隔式即延缓强化。包括定时距式式和变时距式,定比率式和变比率式。定时距式是指强化时间间隔是固定的;变时距式是指强化的时间间隔是变化的。定比率时是指强化与反应次数之间呈一定比例;变比率式是指强化与反应次数之间的比例是变化的。
每一种不同的程式都产生相应的反应模式。连续程式的强化在教新反应时最为有效。间隔式强化又称部分强化,它比起连续程式具有较高的反应率和较低的消退率。定时距式如学生在期终考试前临时抱佛脚就证明了这-点。定比率式对稳定的反应率比较有益,而变比率式则对维持稳定和高反应率最为有效。
在实际教育中,不想要的行为常常不明智地受到了强化。一个教师可能正在作间隔式的强化.一次侥幸就会使学生永远记住这个行为,学生认识到如果他们一直恳求教师,教师就会最终答应他们的要求。
下面是一些强化程式原则:
1.教新任务时,进行即时强化,不要进行延缓强化。在行为主义学习理论中有一条重要的原理就是,后果紧跟行为比后果延续要有效得多。即时反馈有两个作用:首先是使行为和后果之间的联系更为明确,其次它增加了反馈的信息价值。
2.在任务的早期阶段,强化每一个正确的反应,随着学习的发生,对比较正确的反应优先强化,逐渐地转到间隔式强化。
3.强化要保证做到朝正确方向促进或引导。不要坚持一开始就做到完美。不要强化不希望的行为。
所谓塑造,就是通过小步反馈帮助学生达到目标。斯金纳认为“教育就是塑造行为”,如何通过强化去塑造行为,斯金纳采用连续接近(successive appoximation)的方法,对趋向于所要塑造的反应的方向不断地给予强化,直到引出所需要的新行为。例如,训练鸽子或老鼠头抬到一定的高度,只有当其头朝着实验所需的方向抬起来时才强化,下一次要求再多一点,直到全部达到所需的方向和高度。这时,新的行为就塑造成了。
在课堂教学中,塑造是一个重要的工具。假设我们想让学生写一段含有一个主题句和一句总结的英文段落,那么,这一任务包括许多部分:能识别并能写出主题句、佐证材料和总括句;能写出一个完整的句子;能正确使用大小写、标点符号和语法;能正确拼写。如果教师在一节课里教所有这些技能,要求学生写出一段文字,并且根据他们的内容、语法、标点和拼写而评分,那么大多数学生将会失败,学生从练习中将学不到什么。
反之,老师可以一步一步地教这些技能,逐步塑造出最终的技能。学生可以先学如何写主题句,然后写佐证材料,然后写总括句,在此之前可能专门谈论过如何选题立意。然后,对段落和标点也提出要求。最后,拼写也作为一条标准。在每一阶段,学生都有机会获得强化,因为强化的标准都是他们可能达到的。
在塑造行为时要注意这样一条原则:学生必须在他们能力所及的行为范围内得到强化,同时这些行为又必须能向新的行为延伸。学生能在15分钟之内解10道数学题,如果能在12分之内解出就应强化,但不要要求必须在8分之内才予以强化。但是,一个能做20题的学生必须做24题后才强化,不能在少于20题时就予以强化。
4、负强化与惩罚
在当今许多心理学家与教育学著作中,往往都混用负强化与惩罚这两个概念。而在斯金纳看来,这二者是有本质区别的。同强化一样,惩罚也是根据其结果来定义的,惩罚是抑制反应的概率,而强化则是增强反应的概率,其区别如下:
反应后呈现
反应前消除
奖励性刺激
正强化
惩罚(1)
厌恶性刺激
惩罚(2)
负强化
例如,家长为了让孩子努力学习,孩子每次考试取得好成绩都给予奖励,但这次考试前却告诉孩子,取得好成绩也没有奖励了。这次反应前告诉孩子消除奖励性刺激,实际上是一种惩罚(1)。另一个家长使用的是厌恶性刺激,期末考试不及格,罚学生在家学习和增加作业量,而考试成绩好可以少写作业。这便是运用的厌恶性刺激而产生的惩罚(2)。斯金纳认为,惩罚有时在改变行为方面是一种有效的方法。但不是一种理想的方法,虽说惩罚会导致反应的减少,但它只是间接起作用的,它只是抑制而不是消除这种行为。与此同时,惩罚还可能引起负效应,如攻击行为和逆反心理等。所以,斯金纳认为,与其给予厌恶刺激惩罚(2),还不如不给奖励刺激惩罚(1)。
参考资料:
转载:不明
《现代学习理论评析》 王希华