可变奖励(或不可预测的奖励或可变程序的奖励)是一种间歇性提供的奖励。强化程序的设计通常是为了使行为最大化。可变比率程序可以在不可预测的反应次数后提供强化物(例如,以 1:4 的平均比例)。可变时距程序会使用不可预测的间隔(例如,平均为 60 秒)。关于可变奖励的力量,一个流行的例子是对赌博的成瘾。该领域的开创性研究是由 B.F. Skinner 进行的。
另见:
- 预防成瘾的奖励多样性[1]:如何避免可变奖励的消极影响
- 游戏障碍[2]:可变奖励如何导致游戏成瘾、
Thoughts Memo 汉化组译制
题图:#百合イラコン 汗っかきの君 - ふめ〜的插画 - pixiv
原文:Variable reward - supermemo.guru
参考
1. 多样奖励对于预防上瘾的作用 ./490001254.html2. 游戏障碍 ./487955131.html