脑计算将何去何从?

发布者:梁刚健发布时间:2022-08-01浏览次数:74

原文链接:https://mp.weixin.qq.com/s/_6r2QcoTIXdURpr_lNv-Bw

人工智能学家 


来源:内容由半导体行业观察(IDicbank

编译:nature.


摘要

类脑计算新技术有望通过完全不同的方式处理信息,能效极高,并能处理我们加速产生的大量非结构化和嘈杂的数据。为了实现这一承诺,需要一个勇敢而协调的计划,将不同的研究团体聚集在一起,并为他们提供所需的资金、重点和支持。过去我们已经通过数字技术做到了这一点,我们正用量子技术做这件事。现在我们能为类脑计算做这件事吗?


现代计算系统能耗太大,对于日益成为我们生活一部分的复杂AI应用来说,不是可持续发展的平台。但我们往往看不到这一点,尤其在基于云的系统中,通常只关注功能,比如:它们有多快;如何准确;每秒有多少并行操作?我们习惯于即时获取信息,以至于忽略了计算系统给我们这种访问带来的能量和环境后果。然而,每次谷歌搜索都有成本:数据中心目前每年使用约200太瓦时的能源,预计到2031年将增长约一个数量级。类似地,如DeepMindAlphaGoAlphaZero等高端人工智能系统的惊人成就,需要数千个并行处理单元,可以在复杂的战略游戏中击败人类专家,每个单元的功耗约为200瓦。


虽然不是所有数据密集型计算都需要人工智能或深度学习,但深度学习应用如此广泛,我们必须担心它的环境成本。我们还应该考虑包括物联网(IoT)和自主机器人代理在内的应用,这些应用可能不需要总是由计算密集的深度学习算法操作,但仍必须降低它们的能源消耗。如果无数联网设备的能源需求过高,那么物联网的愿景就无法实现。最近的分析表明,人们对计算能力需求的增长速度远远超过了摩尔定律所带来的进步。现在计算能力需求每两个月翻一番(图第1A段)。通过智能架构和软硬件协同设计的结合,取得了显著的进步。例如,自2012年以来,NVIDIA GPU(图形处理器)的性能提高了317倍:远远超出摩尔定律的预期(图1b)—尽管在同一时期,单元的功耗从大约25W增加到大约320W。进一步令人印象深刻的性能改进已经在研究和开发阶段得到证明(图1b,红色),我们可能会取得更多进步。不幸的是,仅靠传统的计算解决方案是不可能满足长期需求的。这点在我们考虑到最复杂的深度学习模型所需的惊人的高训练成本时,尤其明显(1c),我们需要替代的方法。


a、在过去四十年中,以千兆次每秒来表示的计算能力需求的增长。直到2012年,计算能力需求每24个月就翻一番;最近,这个时间缩短到大约每两个月一次。颜色图例表示不同的应用程序域。b,过去五年AI硬件效率的提高。最先进的解决方案使计算效率提高了300多倍。研发中的解决方案有望进一步改进。c,自2011年以来人工智能模型训练成本增加。这样的指数增长显然是不可持续的。


能源问题很大程度上是数字计算系统将数据与处理数据分开存储的结果。这是数字计算系统的经典冯·诺依曼架构,处理器的大部分时间和精力都花在传输数据上。幸运的是,我们可以从生物学中获得灵感来改善这种情况,生物学采用了完全不同的方法——将记忆和处理置于同一位置,以完全不同的方式编码信息,或者直接对信号进行操作,并采用大规模并行处理,例如(专栏 1)。有种系统能很好地实现能源效率和高级功能:那就是大脑。我们意识到关于大脑如何运作,还有很多东西要学习,我们的目标不只是简单地模拟生物系统,但我们仍然可以从过去几十年神经科学和计算神经科学的重大进展中学习。凭借我们对大脑的了解足以用它来激发灵感。


专栏1


我们所说的“神经形态”系统是什么意思?


从大脑中获取灵感,使我们能够以与现有传统计算系统完全不同的方式处理信息。不同的大脑启发(“神经形态”)平台使用不同方法的组合:模拟数据处理、异步通信、大规模并行信息处理或基于峰值的信息表示。这些性质使它们区别于冯·诺伊曼计算机。


神经形态”一词至少涵盖了三个广泛的研究群体,其区别在于他们的目标是模拟神经功能(对大脑进行逆向工程)、模拟神经网络(开发新的计算方法)还是设计新型电子设备。


神经形态工程”研究的是大脑如何利用生物突触和神经元的物理原理来“计算”。神经形态工程师的工作是通过利用模拟电子的物理特性(如载流子隧穿、硅浮栅上的电荷保持以及各种设备或材料属性对场的指数依赖性)定义基本操作,来模拟生物神经元和突触的功能。晶体管被用作具有丰富动态特性的模拟电路元件,而不是二进制开关。


神经形态计算”希望从生物学中找到处理数据的新方法,这可以被认为是神经形态系统的计算科学。研究着眼于模拟生物神经网络的结构和/或操作,这可能意味着存储和计算的共同定位,就像大脑一样;或者可能采用完全不同的计算方法,基于电压峰值来模拟生物系统的动作电位。


支撑一切的是实现仿生功能所需的设备和材料。在这方面,最近的发展预示着新的电子和光子器件,我们可以定制其特性来模拟生物元素,如突触和神经元。这些“神经形态设备”可以提供令人兴奋的新技术,以扩展神经形态工程和计算的能力。在这些新设备中,最重要的是忆阻器:一种电子设备,其电阻是历史的函数。它们复杂的动态电反应意味着它们可以用作数字记忆元件、人工突触中的可变权重、认知处理元件、光学传感器和模拟生物神经元的设备。此外,它们还可能具有生物树突的某些功能,而且它们的动态反应可以产生与大脑类似的振荡行为,不过有争议的是,它们在“混乱的边缘”运转,也可能与一个系统中的生物神经元有关。但他们可以在消耗很少能量的情况下完成所有这些工作。

生物灵感


在生物学中,数据存储与处理是分不开的。同样的元素——主要是神经元和突触——在大规模并行和适应性结构中执行这两种功能。在典型的人类大脑中包含的1011个神经元和1015个突触大约消耗20w的功率,而一个大约相同大小的人工神经网络的数字模拟消耗7.9 MW,这六个数量级的差距给我们带来了挑战。大脑以极高的效率直接处理那些嘈杂信号。这与传统计算机系统中的信号-数据转换和高精度计算形成了鲜明对比,即使是最强大的数字超级计算机,也会在能源和时间上产生巨大的成本。因此,受大脑启发或“神经形态”的计算系统可以改变我们处理信号和数据的方式,无论是在能源效率方面,还是在处理现实世界不确定性的能力方面。


这已经不是一个新想法。20世纪80年代末,加州理工学院(California Institute of Technology)的卡弗·米德(Carver Mead)提出了“神经形态”(neuromorphic)一词,用于描述模拟生物神经系统某些功能的设备和系统。灵感来自于过去几十年的工作,他们将神经系统建模为等效电路,并建造模拟电子设备和系统以提供类似的功能(专栏1)


一个关于“数据”的词。我们用这个术语来描述编码在模拟信号或传感器的物理响应中的信息,以及更标准的以计算为中心的数字数据。当我们提到大脑“处理数据”时,我们描述的是一套完整的信号处理任务,它们不依赖于任何传统意义上的信号数字化。我们可以想象大脑启发系统在不同的水平上运行:从模拟信号处理到使用大型数字数据集。在前一种情况下,我们可以首先避免生成大型数据集;在后者中,我们可以通过远离冯·诺伊曼模型来大大提高处理效率。


当然,我们在许多应用中以数字方式表示数据是有原因的:我们需要高精度、可靠性和确定性。然而,数字抽象抛弃了在晶体管物理学中发现的大量信息,以获得最小的信息量子:单个比特。我们用效率换取可靠性,为此付出了相当大的能源成本。人工智能应用在本质上往往是概率性的,因此我们必须考虑这种权衡是否合理。当由传统的冯诺依曼计算机执行时,支撑人工智能应用的计算任务是十分计算密集的(并且因此是耗能的)。然而,在使用基于尖峰的信息表示的模拟或混合系统上,我们可以更节能地执行类似的任务。因此,在人工智能系统发展和新设备出现的推动下,最近人们对神经形态计算的兴趣再度兴起,这些新设备提供了新的和令人兴奋的方式来模拟生物神经系统的某些功能(专栏1)


神经形态”的定义差异很大。不严格地说,这是一个关于硬件的故事:神经形态芯片旨在集成和利用大脑的各种有用特性,包括内存计算、基于尖峰的信息处理、细粒度并行性、信号处理、抗噪声和随机性、适应性、硬件学习、异步通信和模拟处理。尽管需要实现多少这样的功能才能归类为神经形态这件事存有争议的,但这显然是一种不同于在主流计算系统上实现人工智能的方法。然而,我们不应迷失在术语中,关键问题在于这种方法是否有用。


神经形态技术的方法是在对大脑的结构和功能进行逆向工程(分析)以及目前我们对大脑缺乏知识的情况下,但从我们已知的知识中获得灵感(综合)之间。在前一种方法中,或许最重要的是“人类大脑计划”,这是一个备受瞩目且雄心勃勃的十年计划,由欧盟从2013年开始资助。该项目支持采用和进一步开发两个现有的神经形态硬件平台——spinnaker(在曼彻斯特大学)BrainScaleS(在海德堡大学)——作为开放访问的神经形态平台。这两个系统都实现了大脑结构高度复杂的硅模型,以更好地理解生物大脑的运作。在光谱的另一端,许多研究小组使用选定的生物激发方法来增强数字或模拟电子器件的性能。图2总结了现有神经形态芯片的范围,根据其在分析-合成光谱中的位置和技术平台,将其分为四类。重要的是要记住,神经形态工程不仅仅是关于高级认知系统,而且还在认知能力有限的小型边缘设备中提供能量、速度和安全收益(至少通过消除对云持续通信的需求)




神经形态芯片可以分为模拟生物系统或应用大脑启发原理的新计算应用。它们可以进一步细分为基于具有新颖架构的数字CMOS(例如,尖峰可以在数字领域模拟而不是作为模拟电压实现)和使用某种程度模拟电路实现的那些。然而,在所有的情况下,它们至少具有右边列出的一些特性,这使它们有别于传统的CMOS芯片。在这里,我们对最近开发的神经形态芯片进行分类。每一种的详细细节可以在相关的参考文献中找到:NeurogridBrainsClasesMNIFATDynapDynap-SelRollsSpiritReasonDeepSouthSpinnakerIBM TrueNorth, Intel Loihi, Tianjic, ODIN and the Intel SNN chip.

前景


我们并不认为神经形态系统将或者应该取代传统的计算平台。相反,精确计算应该保留数字计算,而神经形态系统可以处理非结构化数据,执行图像识别,分类噪声和不确定的数据集,并支持新的学习和推理系统。在自主和物联网系统中,它们可以比传统系统节省大量能源。量子计算也是这一愿景的一部分。尽管估计还需要几年的时间,一台实用的量子计算机,肯定会彻底改变许多计算任务。但是,物联网智能传感器、边缘计算设备、自主机器人系统在不依赖云计算的情况下,不大可能采用量子计算,对能够处理不确定和噪声数据的低功耗计算元件的需求仍将存在。我们可以想象数字系统、神经形态系统和量子系统之间的三方协同作用。


正如半导体微电子学的发展依赖于许多不同的学科,包括固体物理学、电子工程、计算机科学和材料科学,神经形态计算具有深刻的跨学科和跨学科性质。物理学家、化学家、工程师、计算机科学家、生物学家和神经科学家都扮演着重要角色。仅仅让来自不同学科的研究人员说一种共同的语言就很有挑战性。在我们自己的工作中,我们花了大量的时间和精力来确保房间里的每个人都以相同的方式理解术语和概念。在计算机科学(特别是人工智能)和神经科学(最初是计算神经科学)社区之间架起桥梁的情况是显而易见的。毕竟,在当今最先进的人工智能系统中发现的许多概念都是在20世纪70年代和80年代出现在神经科学领域的,当然,人工智能系统并不需要完全是生物现实的。我们必须纳入其他学科,认识到我们在人工智能或神经科学方面取得的许多进步是由不同领域促成的——例如,材料科学、纳米技术或电子工程方面的创新。此外,传统的CMOS(互补金属氧化物半导体)技术可能不是有效实现新的大脑启发算法的最佳结构,需要全面创新。尽早让这些社区参与进来,可以减少在已经探索过但失败的方向上浪费精力的风险,也可以减少重新发明轮子的风险。


此外,我们不应忽视在系统级别集成新的神经形态技术的挑战。除了开发受大脑启发的设备和算法,还有一些紧迫的问题,即如何用功能相当的神经形态替代方案来取代现有的主流人工智能系统,这进一步强调了对类脑计算完全集成方法的需求。我们应该指出,尽管有上述潜力,但目前还没有令人信服的商业神经形态技术的证明。现有系统和平台主要是研究工具,量子计算也是如此,它仍然是一个长期的前景。我们不应该因此耽误类脑计算的发展。当前,对低功耗计算系统的需求十分迫切,我们即将通过一种完全不同的计算方法来实现这一目标,商业系统肯定会出现。

抓住机遇


如果需要神经形态计算,如何实现?第一,技术要求。把不同的研究界团结起来是必要的,但这还不够,需要激励措施、机会和基础设施。神经形态社区是一个完全不同的社区,缺乏对量子计算的关注,也缺乏半导体行业的清晰路线图。全球各地的项目正开始收集所需的专业知识,早期阶段的势头正在形成。要实现这一点,资金是关键。对神经形态研究的投资规模远不及数字人工智能或量子技术(专栏2)。尽管考虑到数字半导体技术的成熟,这并不令人惊讶,但这将错失机会。在神经形态的研究和开发方面有一些中等规模的投资,如IBM人工智能硬件中心的一系列大脑启发项目(包括TrueNorth芯片),英特尔的Loihi处理器的开发,以及美国的大脑计划项目,但它们的投资总额远远低于一个有望颠覆数字人工智能技术应有的水平。


神经形态领域是一个庞大且不断增长的领域,但它缺乏一个重点。尽管有许多会议、专题讨论会和期刊出现在这一领域,但仍有许多工作要做,通过将不同领域的专家聚集在一起,以此来努力说服,让资助机构和政府认识到这一领域的重要性。


采取大胆举措的时机已经成熟。在国家层面,政府需要与学术研究人员和产业界合作,建立以任务为导向的研究中心,以加速神经形态技术的发展。这种方法在量子技术和纳米技术等领域十分有效——美国国家纳米技术计划(US National Nanotechnology Initiative)很好地证明了这一点,并提供了关注和激励。这些中心可以是实体的,也可以是虚拟的,但必须汇集不同领域最优秀的研究人员。他们的方法必须与传统电子技术的方法不同,在传统电子技术中,每个抽象层次(材料、设备、电路、系统、算法和应用)都属于不同的领域。我们需要在整个堆栈中进行整体和并行设计。电路设计者在设计系统之前咨询计算神经科学家是不够的,工程师和神经科学家必须在整个过程中合作,以确保尽可能全面地将生物启发原理整合到硬件中。跨学科的共同创造必须是我们方法的重点,研究中心必须容纳广泛的研究人员。


除了必要的物质和金融基础设施,我们还需要训练有素的劳动力。电子工程师很少接触神经科学的思想,反之亦然。电路设计师和物理学家可能对神经元和突触有一定的了解,但不太可能熟悉尖端的计算神经科学。建立培养神经形态工程师的硕士课程和博士培训计划是有充分理由的。英国研究委员会(UK Research Council)赞助博士培训中心(CDTS),该中心是支持已确定需要训练有素研究人员的领域。CDTS可以是单个或多个机构,通过建立跨机构的互补团队,在这些项目上合作的机构将获得实质性的好处。这种项目通常与行业密切合作,建立高技能的研究人员队伍,而传统的博士项目往往无法做到这一点。这是一个很好的例子来开发类似的东西,来刺激新生神经形态工程领域之间的互动,并提供下一代研究人员和研究领导者。开创性的例子包括格罗宁根认知系统和材料研究项目,该项目旨在培养数十名专门研究认知(AI)系统材料的博士生,慕尼黑工业大学的神经工程硕士项目; 苏黎世联邦理工学院神经形态工程模拟电路设计课程;斯坦福大学的大规模神经建模;在塞维利亚微电子研究所开发视觉神经形态系统。在这方面他们还有更多的空间。


类似的办法可以在跨国一级发挥作用。就像在研究中,当最优秀的人与最优秀的人不分国界地合作时,那这种合作就最成功。在神经形态计算这样跨学科研究中,这点至关重要,因此国际研究网络和项目无疑可以发挥作用。早期的例子包括专注于神经形态计算技术的欧洲神经技术联盟,以及位于德累斯顿大学的蔡氏忆阻器中心,该中心汇集了材料、设备和算法领域许多优秀的记忆电阻器研究者。同样,我们可以而且必须做更多的工作。


如何能让这类项目吸引政府的关注?政府对更节能的仿生计算的承诺可以成为更广泛的大规模脱碳推动的一部分。这不仅将解决气候变化问题,还将加速围绕大数据、物联网、医疗保健分析、药物和疫苗发现建模以及机器人等新低碳行业的出现。如果现有行业依赖于更大规模的传统数字数据分析,则会增加能源成本,同时提供次优性能。相反,我们可以创造一个良性循环,在这个循环中,大大减少这类推动下一代颠覆性产业的知识技术的碳足迹,并在此过程中培育出一系列新的神经形态产业。如果这听起来是一项艰巨的任务,那么考虑一下量子技术。到目前为止,英国政府已投入约10亿英镑用于一系列量子计划,主要是在国家量子技术项目的庇护下。一系列的研究中心,汇集了工业界和学术界,将量子科学转化为针对传感器和计量、成像、通信和计算的技术。一个独立的国家量子计算中心建立在这些中心和其他研究人员的工作基础之上,提供演示硬件和软件,以开发通用量子计算机。中国已经建立了一个数十亿美元的中国量子信息科学国家实验室,美国在2018年委托了一项量子信息科学国家战略概述,这导致了一项为期五年的12亿美元的投资,此外还支持了一系列国家量子研究中心。得益于这项研究,全球掀起了一股创立量子技术公司的热潮。一项分析发现,2017年和2018年,私营公司的融资达到了4.5亿美元。尽管神经形态计算技术比量子技术更成熟,并有可能在更短的时间内颠覆现有的人工智能技术,但对神经形态计算并不存在这样的联合支持。在我们设想的未来计算的三个分支中,神经形态的投资严重不足。


最后,谈谈COVID-19大流行可能对我们的论点产生的影响。越来越多的人一致认为,这场危机加速了许多已经发生的事态发展:例如,人们开始更多地在家工作。尽管减少通勤和旅行有直接的好处——一些人估计,危机导致全球二氧化碳排放量减少高达17%——但新的工作方式是有代价的。减少旅行所节省的碳能在多大程度上被增加的数据中心排放所抵消?如果说有什么不同的话,那就是COVID-19的流行进一步强调了开发低碳计算技术(如神经形态系统)的必要性。
我们关于如何实现神经形态系统潜力的信息是明确的:通过建立卓越研究中心,为合作研究提供有针对性的支持;提供灵活的供资机制,以实现快速进展;提供与业界密切合作的机制,以引入商业资金,并产生新的衍生企业和初创企业,类似于已在量子技术方面实施的计划;为下一代神经形态研究人员和企业家制定培训方案;并快速、大规模地完成所有这些工作。


神经形态计算有可能将我们的方法转变为人工智能。由于新技术的结合,以及不断增长的对高效人工智能的巨大需求,我们有了新机遇,需要大胆的想法,以及支持这种想法的大胆举措。我们会抓住机会吗?


专栏2


人工智能融资格局


对“传统”数字人工智能的投资正在蓬勃发展,这是因为需要处理不断增加的数据量,以及需要开发硬件来支持现有的计算和内存密集型算法。英国政府于20184月宣布了一项价值9.5亿英镑的数字人工智能“行业交易”,并得到了现有研究委员会支持。法国宣布2018—2022年政府人工智能投资18亿欧元,德国承诺2018—2025年投资30亿欧元,日本2017年投资26万亿日元。2020年,美国政府对民用人工智能技术的资助为9.73亿美元;由于非人工智能项目经常被包含在已发表的分析中,美国军方的人工智能资助数据更难获得。据估计,中国将在民用和军用人工智能领域投资高达80亿美元,并正在北京附近建设一个21亿美元的人工智能研究园区,欧盟委员会承诺在2018-2020年期间投资15亿欧元。商业投资让这个相形见绌。在美国,有人估计,2019年对人工智能公司的总投资为195亿美元,到2023年,全球投资预计将达到980亿美元左右。如果我们当前的硬件系统无法支持具有潜在破坏性的神经形态算法和架构,就必须考虑到这一金额存在风险。如果神经形态技术能够像它们所承诺的那样提供效率节约和性能提升,那么聪明的投资者就把赌注押在数字系统之外的新技术和架构上。


由于神经形态技术目前缺乏关注和政府层面的可见度,因此无法获得可比数据。此外,研究资金是零碎的,而且是在项目层面,而不是战略层面。尽管已经发表了各种预测,例如,全球神经形态芯片市场将从2021年的2270万美元增长到2026年的5.506亿美元,但最稳妥的结论是,神经形态系统的资金远远落后于数字人工智能或量子技术。



图:数字人工智能技术最近全球公共研究资助的对比。数据以美元等值(2021年汇率)表示,并以百万美元表示。有些是以年为单位的快照(例如UKRI承诺的2020年资金),有些没有特定的期限(例如英国人工智能领域的协议),还有一些是多年计划,但该图显示了数字技术领域的公共资金规模。高效神经形态技术的发展对人工智能生态系统的破坏,将使大部分投资面临风险。