斯金纳箱实验(转)
斯金纳箱实验显示的生理现象,表明生物提会因为环境不同反馈,打破保守原则行为。
实验1:行为与奖励
将一只很饿的小白鼠放入一个有按钮的箱中,每次按下按钮,则掉落食物。
结果:小白鼠自发学会了按按钮。
这个实验比“给狗狗摇铃喂食”的巴普洛夫实验更进了一步,建立行为。
何为学习?就是指将行为与操作者的需求建立相倚性联系。换句话说,使行为者感觉到“行为”与“奖励”是有联系的。
只要通过将行为与奖励不断重复、建立联系,就可以培养起操作者的行为模式。
奖励可以培养行为习惯,很棒吧?
那么看实验2。
实验2:行为与惩罚
将一只小白鼠放入一个有按钮的箱中。每次小白鼠不按下按钮,则箱子通电。
结果:小白鼠学会了按按钮。
但遗憾的是,一旦箱子不再通电,小白鼠按按钮的行为迅速消失。
“惩罚”,作为奖励的邪恶双生子,可以迅速建立行为模式。然而,惩罚具有一定的副作用:它建立起来的行为模式,来得快,去得也快。一旦惩罚消失,则行为模式也会迅速消失。
从长远来看,惩罚对于行为的制止并不会起到显著作用。现实生活中,因为惩罚带来的凡勃伦效应,有时甚至会使惩罚起反作用。
凡勃伦效应:美国学者凡勃伦认为,与产品越降价、需求越增多的一般规律不同,特定的产品越涨价,需求越增多。部分上流阶层的消费目的在于,炫耀自己的社会地位和成功,满足虚荣心,所以价格越高,需求则增加。相反,如果降价,体现上流阶层的界限变得模糊,所以需求减少。
如果想要控制行为者不去进行某个行为时,应找到该错误行为的“奖励物”,移除该奖励,从而制止其错误行为。
然而,即使是奖励,当不再掉落食物时,小白鼠的学习行为也会逐渐消失(虽然消失得稍慢一些)。而且这样太浪费食物了!那该怎么办呢?
接下来是实验3。
实验3:固定时间奖励
将一只很饿的小白鼠放入斯金纳箱中,由一开始的一直掉落食物,逐渐降低到每1分钟后,按下按钮可概率掉落食物。
结果:
小白鼠一开始不停按钮。过一段时间之后,小白鼠学会了间隔1分钟按一次按钮。
当掉落食物停止时,小白鼠的行为消失。
啧啧,失败了。没有培养起小白鼠连续按按钮的行为,反而使小白鼠“偷懒”了。为什么?因为行为者知道短期内行为不会再得到奖励。……好吧。
最关键的实验4。
实验4:概率型奖励
将一只很饿的小白鼠放入斯金纳箱中,多次按下按钮,概率掉落食物。
结果:小白鼠学会了不停按钮。
当不再掉落食物时,小白鼠的学习行为消失速度非常慢。
随着概率越来越低,小白鼠按按钮的学习行为没有变化,直至40-60次按按钮掉落一个食物,小白鼠仍然会不停按按钮,持续很久一段时间。
(同样的,用鸽子做实验,平均每5分钟获得变化时距的食物强化的鸽子,每秒能做出2-3次反应,连续反应长达15小时)
这个实验模拟了为什么“赌博”——如简单的老虎机,或者更复杂的赌博——会给予人类以依赖感,或者说,成瘾性。
由于概率性给予结果,行为者很难直观地判断机制是否失效,所以单次的失败不会给予明显的“惩罚”效果,终止行为者的习惯,从而行为者的学习行为会一直持续下去。
然后是一个有趣的实验5。
实验5:迷信的小白鼠?
好吧,其实实验5还是实验4,概率型斯金纳箱。
结果:这些小白鼠有很多培养出了奇特的行为习惯,比如撞箱子、比如作揖、比如转圈跳舞。
这是因为掉落食物前,小白鼠正好在进行这些行为,于是产生了“迷信”。
许多游戏中传出的谣言,比如“在中午抽奖容易得到大奖”,或者“带满一背包幸运兔脚可以获得更好的装备”之类,其原理与之相同。
为什么会这样?概率性的奖励会让人违背喜欢稳定收益而不是随机收益的本性?
因为,人实在是太喜欢稳定不喜欢随机了,所以把随机变成稳定这件事本身就有着巨大的吸引力。人可以大量通过重复行为把随机收益变成稳定收益。被这种随机变固定的快感蒙敝,人会失去对成本支出的敏感性。
也就是像玩随机掉落宝藏的游戏,一遍一遍去打怪-刷装,关注力全在击倒BOSS瞬间掉落什么宝物上,而忘记了一遍又一遍的机械式重复刷怪操作,早已没有了游戏的乐趣。因为失去了监测重复劳动的敏感性。
同样,赌博的一遍又一遍,关注力在”这把赢了,太爽了“,完全失去了对押注损失的敏感性。
这种心理机制的应用,比比皆是,比如在权术中有:
刑不可知,则威不可测,则民畏上也。—-《春秋左传正义》。
这句话就是说:如果对民,对下人的惩罚,是他们不可预测的,那么,威权也就是不可预测的,他们就会因为害怕不知道哪一会就来到的惩罚而整体上循规蹈矩。反之,如果民众下人,能预测你如何惩罚他们,他们就会在你惩罚的部分老实,不会惩罚的部分放纵大胆。
同样,追求一个妹子时,妹子会本能的很作,为啥?因为“作”是一种无法预测的负面反馈,其实 就是对你的惩罚。当你能预测怎么能得到对方的奖励时,你就会计算成本,对应奖励,当你无法预测怎么得到奖励时,你就失去对成本的敏感性,不计代价的想要换回奖励。 说白了,你要猜她心思,你才会用尽心力。
那么,有没有人免疫这个赌性呢,有。
有两种人,第一种人,对宏观有把控,有一种能力叫做“风险管理能力” 最直白的例子,德州扑克,诈金花,梭哈的扑克玩法,其高手,最重要的就是这个风险管理能力。当然要排除出老千,作弊的人。这种人,你看他,并不是一直都赢,但却总体上赢的。这种人适合做投资这一行。
第二种人,是对“失控”极度厌恶又极度敏感的人,对于‘厌恶失去’远远超过‘获得随机奖励’的喜好。
我对失控厌恶到什么程度?我们曾经在游戏网站“奶牛关”上讨论过这个,敏感的人,在玩《火炎纹章》系列时,是不用强力武器的,铁剑铁枪,钢剑之类的量产武器打到通关,为什么不用什么勇者之枪之类的?因为它们会坏,要管理使用时机,不能随意乱用,这个管理,不能预测的话,就宁愿不去管理,因为管理失败就是风险。
我对这个失控厌恶到,在魔兽世界里,我非常不喜欢任何CD超过两分钟的技能。这种技能即使性能很好,我也不太用,因为要管理使用时机,用错了就是损失,这种心理压力会让我焦虑。 如果我无法控制这个东西,这个流程,我宁愿放弃它的所有好处。
所以在我明知道好游戏,但绝对不会玩的游戏中,
《暗黑地牢》是排第一的,因为它强迫玩家接受失控。
韦诺之战是排第二,不过韦诺已经加了个官方MOD,取消命中的随机性。