用于因果推理和学习的神经脉冲 | PLOS


当一个神经元被驱动超过其阈值时,它就会出现尖峰。

它不传达其连续的膜电位这一事实通常被看作是一种计算上的责任。

在这里,我们表明,这种尖峰机制允许神经元产生对其因果影响的无偏估计,以及一种近似于基于梯度下降的学习方式。

重要的是,上游神经元的活动(作为混杂因素)和下游的非线性都不会使结果发生偏差。

我们展示了尖脉冲如何使神经元解决因果估计问题,并且局部可塑性可以使用尖脉冲不连续学习来近似梯度下降。

背景上下文:
尽管进行了大量的研究,但在机器学习和认知任务建模的性能方面,尖峰神经网络的模型仍然落后于人工神经网络。

鉴于此,我们可能会想,为什么神经元会出现尖峰?

任何神经网络中必须解决的一个关键问题是信用分配问题。
也就是说,一个神经元如何知道它对下游计算和奖励的影响,从而知道它应该如何改变其突触权重来提高?
人工神经网络用反向传播算法解决了这个问题。

我们仍在寻求了解生物神经网络如何有效地解决这个问题。
在这项工作中,我们表明,一个神经元的不连续的、全有或全无的突发反应事实上可以用来估计一个神经元对下游过程的因果效应。

受计量经济学方法的启发,我们表明,一个神经元的阈值反应可以用来获得该神经元对奖励信号的独特贡献,将其与其他可能与之相关的神经元的活动分开。

这一建议为我们在简单的网络和学习任务中探索秒杀的新功能提供了见解。