人类大脑大约有一半的脑区参与视觉信息的处理。大量的信息以每秒10亿比特的速度进入人眼中,经过视网膜神经环路的处理,以每秒1千万比特的速度进入大脑。大脑两个主要的处理视觉信息的结构包括存在于所有脊椎动物中的上丘和只有在哺乳动物中进化出来的视皮层。视觉处理不仅使我们感知所见之物,还可以提取出非常少量的信息来指导我们大约20比特每秒的行为。我们以4个具体研究方向来揭示视觉处理的神经环路机制和计算原理。
1) 视觉特征的神经表征及其环路
视觉处理的第一步是将不同的视觉特征从所看到的景物中提取出来。在视网膜,大约有30类视神经节细胞,每类细胞编码一种视觉特征,并以镶嵌的模式分布在整个视网膜,从而保证每种特征都可以被表征在视空间的所有位置。视网膜把这些处理过的信息并行传到大脑。大脑如何来处理视觉特征?小鼠上丘以功能斑块的形式来表征指向和运动方向,这些斑块对应大约30度的视角,同一斑块内的神经元对指向或运动方向有着相同的偏好。我们将研究诸如此类的视觉特征在上丘和视皮层的表征及其神经环路。
2) 视觉注意的神经机制
注意,一种从海量视觉数据中提取有用信息的过程,对动物如何在复杂多变环境中生存至关重要。视觉注意有两种,外源性注意由外界刺激引发,内源性注意由内在目标引发。这两种注意相互作用去占用有限的资源。我们将研究视觉注意的神经机制。
3) 视觉诱发本能决策行为的神经环路
行为是感觉处理的最终产物。视觉信息是如何用来指导动物行为的?当小鼠侦察到正在逼近的空中捕食者时,它必须决定停住不动还是逃回巢穴。这种本能决策行为因为对动物生存重要所以比较可靠,而其神经环路是在进化过程种形成的,从而适用于同一物种的不同个体。
4) 生物启发的计算机视觉
卷积神经网络,这种受到灵长类腹侧视觉通路启发而提出的算法,引发了计算机视觉的革命。在某些视觉任务,比如图像分类和图像分割,它的表现甚至超过了人类。但是, 卷积神经网络解决视觉问题的方式跟人非常不同,非常小的干扰足以让它把“狗”认成“红酒”或者“厕纸”。我们将解决这种问题,从而提升计算机视觉的可靠性。
更好地理解视觉处理过程中的神经机制不仅能揭示大脑功能的基本神经原理,而且也有助于神经系统疾病的治疗和人工智能系统的设计。