谷歌的人工智能设计芯片告诉我们关于智能的本质

6

本文是我们的一部分yabet468.cc人工智能研究论文综述,一系列探索人工智能最新发现的帖子。www.yabovip4

在同行评议的科学杂志上发表的一篇论文中自然上周,谷歌大脑的科学家们介绍了深度强化学习技术在平面规划中,布置计算机芯片的不同部件的位置的过程。

研究人员设法使用加强学习技术设计下一代张量处理单元,谷歌专业的人工智能处理器。www.yabovip4

软件在芯片设计中的应用并不新鲜。但据谷歌研究人员称,新的强化学习模式“自动生成芯片地板,这些平面图在功耗、性能和芯片面积等所有关键指标上都优于或可比人类生产的芯片底板”,而且它在一小部分时间内就可以做到这一点,这需要人类去做。

人工智能优于人类的表现已经引起了广泛的关注。一家媒体将其描述为“设计计算机芯片的速度比人类快的人工智能软件”,并www.yabovip4写道“人类需要几个月的时间来设计芯片,而[谷歌]的新人工智能可以在不到6小时的时间内完成。”

另一个出口写道,“AI设计芯片的良性循环看起来只是刚刚入门。”

但是在阅读论文的同时,令我惊讶的是,我不是用于设计计算机筹码的AI系统的复杂性,而是人工智能之间的协同作用。www.yabovip4

类比,直觉和奖励

围棋游戏芯片平面图

该论文将该问题描述为:“芯片地板规划涉及将网表放在芯片画布(二维网格)上,以便性能指标(例如,功耗、时间、面积和布线)得到优化,同时遵循密度和路由拥挤的硬约束。”

基本上,您想要做的是以最优化的方式放置组件。然而,与其他问题一样,随着芯片中组件数量的增加,寻找最佳设计变得更加困难。

现有的软件有助于加快发现芯片排列的过程,但当目标芯片变得越来越复杂时,它们就跟不上了。研究人员决定从中汲取经验加强学习解决了其他复杂的空间问题,如游戏。

“芯片平面图是相似的[重点挖掘]对于一个不同的棋子(例如,netlist拓扑、宏计数、宏大小和纵横比)、板(不同画布大小和纵横比)和win条件(不同评估指标的相对重要性或不同密度和路由拥塞约束)的游戏,”研究人员写道。

这是人类智慧最重要和最复杂的方面之一的表现:类比.我们人类可以从我们解决的问题中汲取抽象,然后将这些抽象应用到一个新问题。虽然我们采取了这些技能理所当然,但他们让我们在转移学习方面非常善于。这就是研究人员可以将芯片平面图的原因作为棋盘游戏的原因,并且可以以同样的方式解决其他科学家解决了去的游戏。

深度加强学习模型可以特别擅长搜索非常大的空间,这是一个物理上不可能对大脑的计算能力。但科学家们面临着比Go更复杂的数量级的问题。“[”[该]在网格上放置1,000个节点的状态空间,具有1,000个细胞的1,000级!(大于102,500),而Go的状态空间为10360研究人员写道。他们想要设计的芯片将由数百万个节点组成。

他们解决了复杂性问题人工神经网络这可以将芯片设计编码为向量表示,使其更容易探索问题空间。报纸上说,“我们的。直觉(我强调的是)能够完成芯片放置一般任务的策略也应该能够在推断时将与新的看不见的芯片相关的状态编码成有意义的信号。因此,我们训练了一种神经网络架构,能够预测新网络列表放置的回报,最终目标是使用这种架构作为我们政策的编码器层。”

直觉这个词通常使用得很松散。但这是一个非常复杂而不了解的过程这涉及到经验、无意识知识、模式识别等。我们的直觉来自多年在一个领域工作,但也可以从其他领域的经验中获得。幸运的是,通过高功率计算和机器学习工具

值得注意的是,强化学习系统需要精心设计的奖励。事实上,一些科学家认为具有正确的奖励功能强化学习足以达到人工智能。然而,如果没有正确的奖励,RL代理可能会陷入无尽的循环中,做愚蠢和毫无意义的事情。在下面的视频中,一个扮演海岸跑步者的RL经纪人正在试图最大限度地提高积分,放弃了主要目标,即赢得比赛。

谷歌的科学家们将平面规划系统的奖励设计为“代理线长、拥塞和密度的负加权和”,权重是在强化学习模型开发和训练过程中必须调整的超参数。

有了正确的奖励,强化学习模型就能够利用它的计算能力,找到各种方法来设计楼层平面图,使奖励最大化。

固化数据集

利用该系统开发了一种用于深部神经网络的神经网络监督式学习.有监督的机器学习在训练过程中需要标记数据来调整模型的参数。谷歌的科学家们创建了“一个包含10,000个芯片放置的数据集,其中输入的是与给定放置相关联的状态,而标签则是这种放置的奖励。”

为了避免手工创建每个平面图,研究人员使用了人工设计的计划和计算机生成的数据。关于训练数据集中包含的算法生成的示例的评估涉及到多少人力,本文没有太多信息。但是,如果没有高质量的培训数据,监督学习模型最终会得出糟糕的推论。

从这个意义上说,人工智能系统不同于AlphaZero等其他强化学习程序,后者在不需要人工输入的情况下制定了自己的博弈策略。在未来,研究人员可能会开发一种RL代理,它可以设计自己的楼层平面图,而不需要监督学习组件。但我的猜测是,考虑到问题的复杂性,解决这类问题将继续需要结合人类直觉、机器学习和高性能计算。

强化学习设计与人的设计

谷歌研究人员提出的工作的有趣方面之一是芯片的布局。我们人类用各种捷径来克服大脑的局限。我们不能在一大块时间内解决复杂的问题。但是我们可以设计模块化、层次化的系统来划分和克服复杂性。我们的自顶向下架构的思考和设计能力在开发能够执行非常复杂任务的系统中发挥了很大的作用。

我将展示软件工程,我自己的专业领域。从理论上讲,您可以在单个文件中的一个非常大,连续的命令流中写整个程序。但软件开发人员永远不会以这种方式编写他们的节目。我们在小块,函数,类,模块中创建软件,可以通过定义良好的接口相互交互。然后,我们将这些部分嵌入更大的碎片并逐渐创建一个组件的层次结构。您不需要阅读程序的每一行以了解它的内容。模块化使多个程序员能够在单个程序上工作和多个程序来重用以前构建的组件。有时,只需查看程序的班级架构就足够了,以指向您的正确方向,找到错误或找到正确的位置添加升级。我们经常贸易速度为模块化和更好的设计。

经过一种时尚,在电脑芯片的设计上也可以看到同样的情况。人类设计的芯片在不同模块之间往往有着清晰的界限。另一方面,谷歌强化学习代理设计的地板平面图发现阻力最小,无论布局如何(见图)。

谷歌智能芯片
右:手动设计芯片左:AI设计芯片

我有兴趣查看这是否将成为未来的可持续设计模式,或者如果它需要在高度优化的机器学习的设计和人工工程施加的自上而下的顺序之间需要某种类型的折衷。

ai +人类智力

正如谷歌强化学习——由芯片设计师展示的那样,AI硬件和软件的创新将继续需要抽象思维,找到要解决的正确问题,发展对解决方案的直觉,并选择正确的数据类型来验证解决方案。这些技能是更好的人工智能芯片可以提高但不能取代的。

在一天结束时,我认为这不是一个“AI Outsmarting人类”的故事“AI创造了更智能的AI,”或AI发展“递归自我改善“能力。它是人类找到使用AI作为支配的方法的表现形式,以克服自己的认知限制并扩展其能力。如果有一个良性循环,那是一个人和人类找到更好的合作方式。

1条评论

本网站使用AkisMet减少垃圾邮件。了解如何处理评论数据