人工智能计算体系与通讯架构的革新展望

2021-05-29 20:57:24

导读人工智能从20世纪50年代开始经历了60年起伏的发展历程。其中 AI共经历了2次发展的春天和冬天现在正在经历第3个春天即以数据为驱动

人工智能从20世纪50年代开始经历了60年起伏的发展历程。其中 AI共经历了2次发展的春天和冬天现在正在经历第3个春天即以数据为驱动力的深度学习。谷歌的AlphaGo、AlphaZero、AlphaFold是很好的标志性产品。

佩德罗多明戈斯曾总结了 AI 的五大流派包括符号、进化学派、类比学派、贝叶斯学派和连接机制。未来AI的发展趋势最大的可能是借各种流派之长创造新的AI算法既包含逻辑符号也有数据和知识还要借鉴人类的进化和大脑的特点。所以当前无论是科学研究还是产业发展都在思考下一轮AI的突破点在什么地方。

算力需求飞速增长的瓶颈

对深度学习来说半导体与芯片架构领域的进步是不可或缺的发展动力。谷歌公司的杰夫狄恩曾说过：“数据+算法+算力=数据+100×算力”。也就是说他认为在数据、算法和算力三大因素中算力占据着绝对的主导地位算法则相对来说没有那么重要。

随着时代的发展深度学习在训练过程中产生的计算量可以分成两个阶段：在深度学习发展的初期阶段训练产生的计算量的增长速率相对较慢；近10年间计算量以每年10倍的速率增长远远超过摩尔定律每18~24个月提高2倍的增长速率。

深度学习训练过程中计算量需求的发展

以OpenAI发布的预训练模型GPT为例来说明近几年来机器学习领域对算力需求的飞速增长。2018年6月发布的GPT-1是在约5GB的文本上进行无监督训练针对具体任务在小的有监督数据集上做微调得到包含1.1亿参数的预训练模型；而2019年2月发布的GPT-2则是在约40GB文本上进行无监督训练得到具有15亿参数的预训练模型；而2020年5月公布的GPT-3则是在 499B tokens（令牌）的数据基础上训练得到包含1750亿参数的模型。在不到2年的时间内模型参数从1.1亿的规模增长至1750亿而单次训练GPT-3就需要花费1200万美元模型在飞速发展的同时带来的是巨大的算力要求和高成本的代价。

传统计算与通讯范式的瓶颈

人工智能领域对算力的需求驱动了新算力的发展。要想谋求更高效率的计算就需要回到计算和通讯领域最基本的理论和范式。在过去的几十年间涌现出了许许多多的定律和体系而其中有三个定律和体系被视为计算与通讯范式的根本。

第一个是香农定律（Shannon Theroy）。香农是信息论的奠基者他引入了信息熵的概念为数字通信奠定了基矗其实香农定律定义了三个极限分别为无损压缩极限E、信道传输极限C、有损压缩极限R（D）。目前我们已经接近这些极限。

第二个是冯诺伊曼架构（Von neumann Structure）。在冯诺伊曼架构中计算机由运算器、控制器、存储器、输入设备和输出设备5个基本部分组成具有程序存储、共享数据、顺序执行的特点。冯诺伊曼架构简单且漂亮是图灵机的优秀范例至今仍被广泛地应用。然而冯诺伊曼架构的设计构成了运算器和存储器间的瓶颈这对深度学习的发展造成了一定的限制。

信息论的研究方向

第三个是摩尔定律（Moore‘s Law）。戈登摩尔（Gordon Moore）总结认为集成电路上可以容纳的晶体管数目大约在18 个月左右便会增加一倍。而现在晶体管数目的增长越来越慢摩尔定律逐步趋向于饱和阶段而我们对计算能力的需求却飞速提升不断提升的算力需求与芯片技术发展趋缓的矛盾日趋显现。

计算体系与通讯架构的革新展望

在过去的60年里这三个基本理论在计算和通讯领域建立了决定性的基础然而日趋逼近的极限也使得当前AI技术的发展逐步接近瓶颈。为了避免技术的停滞不前产业界或许可以从以下三个方面做出一些突破和革新。

首先对信息重新定义。香农于上世纪40年代对信息熵、速率失真函数R（D）和信道容量C做出了定义而这些定义是基于比特的基础实现的。以视频图像举例过去我们一直采用比特来描述信息；后来我们从数字的层面使用像素、运动向量、宏块（macroblock）和区域（regions）结合的方式来描述图像；之后我们上升到从内容层面来描述图像比如一个身体部位是脸部还是手部等；现在我们对图像的描述上升到语义层面比如“是谁”“在做什么动作”“是否在睡觉”“眼睛在看什么”等这些问题从语义的层面描述了图像传达的信息。当信息的描述方式发生变化时熵的概念也发生了变化。比方说过去我们用比特的形式来描述图像失真现象而现在我们用生成对抗网络（Generative Adversarial Networks GAN）生成图像用肉眼来看GAN输入的图片和生成的图像几乎是一致的但是从比特层面来比较会发现二者十分不同。因此如何从语义、特征和内容的角度来定义熵与速率失真函数是我们未来需要研究的问题。另外香农理论从最开始的点到点通讯扩展到后来的多用户信息论。但是在当下的互联网时代面对海量的交互信息部分香农理论已不再适用学术界却没有提出一个新的完善的理论。过去的信息更多的是人与人之间的传输而现在的信息则更多地面向机器比如3D Point Cloud、3D SS、Genomics、Geometry等所以我们需要新的算法和新的标准。

计算体系与通讯架构的研究方向

第二我们需要新的计算范式。包括量子计算、类脑计算和生物计算等在内的新的计算范式能够为计算瓶颈提供解决途径。

第三我们需要新的计算体系和通讯架构突破冯诺伊曼体系架构的限制。首先我们需要新的传感器、新的数据流架构和计算模式以及高速的存储这些都与传统的冯诺伊曼架构不同。我们还需要新的通讯架构即5G技术和边缘计算。5G技术首次在应用层上实现了“三网合一” 比提升传输的速度更加有效。此外 5G技术更好地解决了延时问题并带来了新的应用如百度的阿波罗项目中有一个服务叫做“云代驾” 通过5G技术让远程的安全操作员实时了解车辆所处的环境与状态在自动驾驶无法完成的场景下接管车辆完成远程协助。但3G和4G网络的延迟使得“云代驾”模式无法成为现实必须通过5G网络来解决延迟问题。很多人认为当前的5G技术在能耗和覆盖率等方面还没有达到预期但任何新技术的发展都需要时间相信在未来的三五年后 5G技术能够为用户、工业和产业界带来巨大的变革。

芯片的升级对产业界的作用是显著的近年来国内有许多公司在芯片领域有所成就。以百度的昆仑AI芯片为例第一代昆仑芯片采用14nm先进工艺 2.5D封装使用HBM内存可以达到 512GB/s 的带宽。而预计于2021年量产的第二代昆仑芯片采用7nm先进工艺性能是第一代昆仑芯片的3倍同时耗能减少具备了大规模片间互联的能力进步显著。责任编辑：YYX

免责声明：本文由用户上传，如有侵权请联系删除！

标签：