新型光芯片可执行深度神经网络关键计算

  科技日报北京 12 月 2 日电 (记者张佳欣)2 日发表在《自然·光子学》杂志上的论文称,美国麻省理工学院科学家开发出一种全集成光芯片。它能以光学方式执行深度神经网络所需的所有关键计算,为制造能实时学习的高速处理器打开了大门。

  这种新型光芯片能够在不到半纳秒的时间内,完成机器学习分类任务的关键计算,性能与传统硬件相当。该芯片由相互连接的模块组成,形成一个光学神经网络,并采用商业代工工艺制造,这有助于技术的扩展和与电子产品集成。

  深度神经网络由多层相互连接的节点组成,执行线性和非线性操作以处理复杂数据。其中,非线性运算(如激活函数)使深度神经网络能够解决复杂问题。2017 年,麻省理工学院恩格伦德小组与马林·索尔贾契奇实验室合作,在光芯片上演示了能执行矩阵乘法的光学神经网络,但这种设计无法在芯片上直接进行非线性操作。设计的难题在于,触发光学非线性非常耗电。

  后来,研究团队开发了一种非线性光学功能单元(NOFU),克服了这一挑战。他们通过结合电子学和光学技术,在芯片上实现了非线性操作,从而实现在光芯片上构建光学深度神经网络。其中,神经网络参数编码作为光信号,通过可编程分光镜阵列进行矩阵乘法,再由 NOFU 实现非线性功能,无需外部放大器,能耗极低。

  该光芯片在训练测试中准确率超 96%,推理准确率超 92%,且执行关键计算时间不到半纳秒。整个电路采用与制造 CMOS 芯片相同的基础设施和工艺,有利于大规模生产和降低制造误差。这一研究为在光芯片上高效训练深度神经网络提供了可能。

  从长远来看,光芯片有望实现更快、更节能的深度学习,适用于激光雷达、天文学和粒子物理学等领域的研究或高速电信等计算要求高的应用。

  论文链接:Single-chip photonic deep neural network with forward-only training