清华团队研制出全球首款多阵列忆阻器存算一体系统

科技工作者之家 2020-02-26

来源:科技日报

金凤

想让手机听得懂你的口音、能处理堪比“阿尔法狗”人机大战的数据量,需要借助强大的芯片算力。

传统的芯片计算处理技术,会分别由存储芯片和CPU进行数据存储和计算。数据来回“搬运”处理,耗时长,功耗大,随时有“交通堵塞”的风险。如果存储和计算能力可以“合体”到一张芯片,信息处理能力将事半功倍。

2月26日,记者从清华大学获悉,该校微电子所、未来芯片技术高精尖创新中心钱鹤、吴华强教授团队,与合作者共同研发出一款基于多个忆阻器阵列的存算一体系统,在处理卷积神经网络时的能效,比图形处理器芯片高两个数量级,大幅提升计算设备的算力,且比传统芯片的功耗降低100倍,相关成果近日发表于《自然》。

如用基于其设计的芯片生产手机,芯片的算力将使手机几乎掌握“读心术”,听懂你的声音,知道你喜欢哪些照片,和你越来越亲近。

wt_a32302020227020351_7d8e7e.jpg

基于忆阻器芯片的存算一体系统。受访者供图

“存算一体”忆阻器打破算力瓶颈

如果我们把居家生活比作存储,把上班比作计算,每天上班路上会消耗时间、能量,遇到早晚高峰,通勤时间会更长。这个场景和信息处理有很多相似之处,如果存储和计算合二为一,就相当于居家办公一样,能减少通勤时间也能节省体力消耗,可以用更小的功耗实现更大的算力,减少数据传输的延迟。

随着人工智能应用对计算和存储需求的不断提升,集成电路芯片技术面临诸多新挑战。一方面,摩尔定律“渐行渐远”,通过集成电路工艺微缩的方式获得算力提升越来越难;另一方面,计算与存储在不同电路单元中完成,会造成大量数据搬运的功耗,增加延迟。

所以,如何用计算存储一体化突破AI算力瓶颈,成为近年来国内外的科研热点。寻找合适的硬件,是提升算力的基础之一。

“基于忆阻器的新型存算一体架构,可以打破算力瓶颈,满足人工智能等复杂任务对计算硬件的高需求。该团队的研究成员之一、清华大学未来芯片技术高精尖创新中心教授吴华强告诉科技日报记者。

忆阻器,是继电阻、电容、电感之后的第四种电路基本元件,这种组件的电阻会随着通过的电流量而改变。而且即使电流中断,它的电阻仍然会停留在之前的值。用于计算领域,这意味着,即使断电了,数据还可以保留。再加上忆阻器的尺寸小,可以大规模的集成,功耗又低,又适合做模拟计算,所以可以用来尝试做存算一体、低能耗类脑计算。

不过,想让忆阻器阵列实现芯片的功能,还需解决器件、系统、算法等方面的瓶颈。

“忆阻器固有的非理想特性,例如器件间波动、器件电导卡滞、电导状态漂移等,会导致计算准确率降低;此外,在架构方面,忆阻器阵列实现卷积功能需要以串行滑动的方式连续采样、计算多个输入块,无法匹配全连接结构的计算效率。”吴华强说。

wt_a72372020022020352_81503a.jpg

研究团队成员高滨、姚鹏、吴华强、张清天、唐建石(从左到右)。受访者供图

DIY材料和器件,曾一度崩溃

十年磨一剑,波澜起伏。如何优化材料和器件结构,制备出高性能的忆阻器阵列,来路并不平坦。吴华强用“一度崩溃”来形容。

“材料和工艺集成是最大的困难,因为没有代工厂,只能在实验室摸索,2012-2013年我们研究用忆阻器做存储时,由于材料器件优化及集成工艺还不成熟,导致器件的一致性不好,良率不高,很崩溃。2014年后,我们与中科院微电子所、北京大学等单位合作,制备工艺慢慢提升。

忆阻器性能好坏,很大程度上取决于材料的选择与组合。吴华强说,在选择材料时,团队会考虑所选材料未来是否适合产业化,材料的物理参数是否易调控。

本着这些原则,团队在常用于忆阻器的二氧化铪材料上,添加了一层界面调控层。这个界面调控层是一种金属氧化层材料,它的氧成分占比,可以根据加工工艺的不同来精确控制。通过这种方法,可以比较有效的控制二氧化铪忆阻层中的微观变化,以及内部的温度和电场。

“界面调控层就像一层口罩,不仅能隔绝病毒、灰尘,还能保暖、保湿。界面调控层类似 ‘口罩’的设计,使我们的器件具有非常优异的电学特性,而且可以在工厂里大规模生产。”吴华强说。

wt_a22322000227020352_845a54.jpg

多个忆阻器阵列芯片协同工作示意图。受访者供图

会率先应用在人工智能领域

其实,早在2017年5月,该团队就曾在《自然通讯》发表成果,首次实现了基于1024个氧化物忆阻器阵列的类脑计算,将氧化物忆阻器的集成规模提高了一个数量级。这使芯片更加高效地完成人脸识别计算任务,将能耗降低到原来的千分之一以下。

此次研究,该团队则集成了8个包含2048个忆阻器的阵列,以提高并行计算的效率。

“这次研究的意义不仅是忆阻器的阵列翻番,多阵列带来的阵列间的信号传递,系统精度控制,都是面临的新挑战。”吴华强介绍,为解决器件非理想特性造成的系统识别准确率下降问题,他们提出一种新型的混合训练算法,仅需用较少的图像样本训练神经网络,并通过微调最后一层网络的部分权重,使存算一体架构在手写数字集上的识别准确率达到96.19%,与软件的识别准确率相当。

“用软件在传统计算架构上进行计算,采用的是存储、计算分离的架构,准确率高,能耗大,速度慢;但现在在存算一体芯片上,也可以实现和软件识别同样的效果,意味着存算一体芯片可以提高速度、降低能耗,但是准确率依然很高。

此外,团队提出了空间并行的机制,将相同卷积核编程到多组忆阻器阵列中,各组忆阻器阵列可并行处理不同的卷积输入块,提高并行度来加速卷积计算。

在此基础上,团队搭建了全硬件构成的完整存算一体系统,在系统里集成了多个忆阻器阵列,并在该系统上高效运行了卷积神经网络算法,成功验证了图像识别功能,证明了存算一体架构全硬件实现的可行性。

吴华强畅想,忆阻器的“存算一体”潜力,会率先应用在人工智能领域,如果用基于忆阻器涉及的芯片生产手机,那么芯片的算力几乎可以让手机掌握“读心术”,“它能听懂你的声音,知道你喜欢哪些照片,会跟你越来越亲近、越来越智能。

来源:kjrbwx 科技日报

原文链接:http://mp.weixin.qq.com/s?__biz=MzI3NDI5MjI4OQ==&mid=2247541647&idx=3&sn=e9f84d28be473f85698b3ab2ff5358af&chksm=eb1428a1dc63a1b7545ebd08be4361b677abca92554f56c86bb566a2f78d76e8637a3b21252d&scene=27#wechat_redirect

版权声明:除非特别注明,本站所载内容来源于互联网、微信公众号等公开渠道,不代表本站观点,仅供参考、交流、公益传播之目的。转载的稿件版权归原作者或机构所有,如有侵权,请联系删除。

电话:(010)86409582

邮箱:kejie@scimall.org.cn

芯片 卷积 忆阻器

推荐资讯