撰文 | 王小果
责编 | 兮
多巴胺参与奖赏、激励和快乐,被认为是大脑的“奖赏中心”,也参与成瘾、动机行为、工作记忆、推理论证、反思探究行为以及整体智力等认知和行为。奖赏刺激作用在动物或者人上会出现三个结果:快感、动机和学习。多巴胺与奖励的关系现在被称为神经递质关联的最具代表性的行为之一。通俗的说,让人成功预测一件事情的发生时就会产生多巴胺,比如听到铃声后得到了食物,除了食物获得产生的多巴胺以外还会额外产生一些多巴胺,这时人就会更快乐;而当预测错误的时候抑制多巴胺的分泌,就会产生慌张的感觉。早在1997年Schultz等人提出了“奖赏预测误差假说 (reward prediction error hypothesis)”-多巴胺细胞编码“奖赏预测误差”,这种误差信号可以指导学习【1】。
图片引自:https://lifehacker.com
2019年5月21日,美国加利福尼亚大学旧金山分校神经科学系Joshua D. Berke教授在Nature发表题为Dissociable dopamine dynamics forlearning and motivation的文章,进一步揭示多巴胺细胞编码“奖赏预测误差”的工作方式。
研究人员利用Bandit-task奖赏行为学实验,在这个实验中大鼠得到奖赏越多,它就越想完成任务。有意思的是,多巴胺信号和奖赏之间的相关性关系具有空间特异性,仅仅出现在腹侧前额叶皮层、伏隔核(NAc)核心区(图1)。
图1 高效液相色谱和微透析检测21种神经递质与奖赏行为的变化关系
根据多巴胺细胞反应的速度存在三种亚型:第一种是快速反应(Phasic),在刺激出现之后100-200毫秒就出现多巴胺信号;第二种是缓慢反应,会在刺激出现之后10分钟左右才会出现多巴胺信号;第三种是持续性(Tonic)反应,刺激出现之后多巴胺信号一直存在。这三种信号之中,只有亚秒级的多巴胺信号编码的是奖赏预测误差的信息。微透析技术检测神经递质存在时间分辨率不足的问题,为解决这一问题,研究人员利用在体光纤记录系统结合遗传编码的多巴胺指示剂(将绿色荧光蛋白与多巴胺受体融合而成,当与多巴胺结合后荧光变亮)再次验证上述实验结果。此外,发现是多巴胺细胞的快速反应,不是缓慢反应,与奖赏行为存在关联性。多巴胺细胞存在逐级处理模式,首先检测出刺激的有无(这种刺激存在潜在的奖赏,reward rate),然后才会进行价值(value)的评估【2】。在Bandit-task奖赏行为学实验中,NAc核心区多巴胺细胞的快速响应过程中与价值(value)更相关(图3)。
图3 不同刺激对多巴胺引起的结果偏向
研究人员进一步发现中脑腹侧被盖区(VTA)的多巴胺信号与动机行为相关,尽管NAc核心区接受来自侧面中脑腹侧被盖区(VTA)的多巴胺投射【3】,但是NAc核心区多巴胺细胞与价值的相关性并不是由VTA的多巴胺细胞放电引起的(图4)。
图4 ,VTA的多巴胺信号与动机行为相关
总的来说,这项研究主要发现VTA的多巴胺信号与动机行为相关,NAc核心区多巴胺细胞与价值更相关。多巴胺介导的预测误差阶段有着具体实际意义—正是由于我们的期待值可能和实际会获得奖赏并不一致,这才驱动我们规定时间内学习更多以获得奖赏。
原文链接:
https://doi.org/10.1038/s41586-019-1235-y
制版人:小娴子
参考文献
1. Schultz, W., Dayan,P., & Montague, P. R. (1997). A neural substrate of prediction andreward. Science, 275(5306), 1593-1599.
2. Hamid, A. A. et al.Mesolimbic dopamine signals the value of work. Nat. Neurosci. 19, 117–126(2016)
3. Saunders, B. T.,Richard, J. M., Margolis, E. B. & Janak, P. H. Dopamine neurons createPavlovian conditioned stimuli with circuit-defined motivational properties.Nat. Neurosci. 21, 1072–1083 (2018).
BioArt,一心关注生命科学,只为分享更多有种、有趣、有料的信息。关注请长按上方二维码。投稿、合作、转载授权事宜请联系微信ID:bioartbusiness 或邮箱:sinobioart@bioart.com.cn。原创内容,未经授权,禁止转载到其它平台。