Reservoir computing model of prefrontal cortex creates novel combinations of previous navigation sequences from hippocampal place-cell replay with spatial reward propagation
论文链接:https://journals.plos.org/ploscompbiol/article?id=10.1371/journal.pcbi.1006624
背景
小鼠在复杂空间导航的能力与海马体中位置细胞的回放有关。spatial navigation capacity involves the replay of hippocampal place-cells during awake states
本文让小鼠学习TSP问题,学会了强化学习中的空间信用分配问题(spatial credit assignment)
这篇工作基于两篇之前的工作:
- Gupta AS, van der Meer MA, Touretzky DS, Redish AD. Hippocampal replay is not a simple function of experience. Neuron. 2010; 65(5):695–705. https://doi.org/10.1016/j.neuron.2010.01.034 PMID: 20223204.
- Liu K, Sibille J, Dragoi G. Generative Predictive Codes by Multiplexed Hippocampal Neuronal Tuplets. Neuron. 2018; 99(6):1329–41. e6. https://doi.org/10.1016/j.neuron.2018.07.047 PMID: 30146305
使用海马体的序列重放功能,实现对运动序列的优化,最优路径重放的频率会更高。
主要工作
- 使用RNN模拟PFC,因为皮层连接大部分是局部而复发性的。
- 解决TSP问题中的两个假设:
- 非最优轨迹(non-optimal trajectories)里,奖励之间的距离比近最优轨迹(near-optimal trajectories)中奖励之间的距离大。在重放中持有轨迹出现较少,以此规则获得最优轨迹。
- 在最近激活的位置细胞重放中,正向和反向轨迹同时被编码。反向的重播允许模型在正方向和反方向上利用信息,但实际运动中,小鼠只会进行正向的运动。
- 面对的挑战:
- 从无序的片段路径中学习全局的place cell激活序列
- 将多个非最优的序列高效连接成一个通往目标位置的路径
- 正向学习轨迹并反向生成它。
- 海马和PFC的连接证据:Shin JD, Jadhav SP. Multiple modes of hippocampal–prefrontal interactions in memory-guided behavior. Current opinion in neurobiology. 2016; 40:161–9. https://doi.org/10.1016/j.conb.2016.07.015 PMID: 27543753
方法
Place-cell
- 基本设置:
- 时间步N
- 轨迹
- 位置
- 2D高斯位置场:
, 是位置细胞序号, 是第k个位置细胞的平均发放率, 是常数,用来约束位置神经元的最高激活大部分包含在以 为中心, 为半径的圆中 是第 个位置场的半径 是控制位置细胞空间选择半径阈值
- 通过K个径向基函数来实现定位:
- place cell可以进一步调研,这个跟脑内GPS有关(还有grid cell, head direction cell)
Hippocampus replay
参考文献:Carr MF, Jadhav SP, Frank LM. Hippocampal replay in the awake state: a potential substrate for memory consolidation and retrieval. Nature neuroscience. 2011; 14(2):147–53. https://doi.org/10.1038/nn. 2732 PMID: 21270783
random replay generative model
a snippet
Reward propagation
- 使用TD-
算法更新预测奖励V
Snippet generation during replay
结论
上丘脑到丘脑底部回路superior colliculus–subthalamus (SC–S) pathway 是决定hunting的神经基础