谷歌的AI设计芯片告诉我们智力的性质

6.

本文是我们的一部分yabet468.ccAI研究论文的评论这是一系列探索人工智能最新发现的文章。www.yabovip4

在同行评审科学期刊上发表的论文中自然上周,谷歌Brain的科学家介绍了一个深增强学习技术对于平面图,可以安排计算机芯片不同部件的放置。

研究人员设法使用加强学习技术设计下一代张量处理单元,谷歌专业的人工智能处理器。www.yabovip4

在芯片设计中使用软件并不是什么新鲜事。但据谷歌研究人员称,新的强化学习模型“自动生成的芯片平面在功耗、性能和芯片面积等所有关键指标上都优于或可与人类生产的芯片平面相比。”而且它只花了人类很短的时间。

AI对人类表现的优势引起了很多关注。一个媒体插座将其描述为“可以比人类更快地设计计算机筹码的人工智能软件www.yabovip4”并写道“将在谷歌的”新的AI在不到六个小时内被梦想为“将采用人类月份的芯片。”

另一个出口写道,“AI设计芯片的良性循环看起来只是刚刚入门。”

但是在阅读论文的同时,令我惊讶的是,我不是用于设计计算机筹码的AI系统的复杂性,而是人工智能之间的协同作用。www.yabovip4

类比、直觉和奖励

棋盘游戏芯片布局

本文描述了以下问题:“芯片平面图涉及将网表放置到芯片帆布上(二维网格),以便优化性能度量(例如,功耗,定时,区域和Wirelength),同时遵守密度的硬度限制和路线拥堵。“

基本上,你要做的就是以最优的方式放置组件。然而,与其他问题一样,随着芯片中组件数量的增加,找到最佳设计变得更加困难。

现有软件有助于加快发现芯片布置的过程,但是当目标芯片在复杂性中增长时,它们会缩短。研究人员决定从路上汲取经验加强学习解决了其他复杂的空间问题,如游戏。

“芯片平面图是类似的研究人员写道:“(重点挖掘)游戏的各个部分(例如,网络列表拓扑,宏计数,宏大小和宽高比),板(不同的画布大小和宽高比)和获胜条件(不同评估指标或不同密度和路由拥塞约束的相对重要性)。”

这是人类智慧最重要和最复杂的方面之一的表现:类比.我们人类可以从我们解决的问题中提取抽象概念,然后将这些抽象概念应用到新的问题中。虽然我们认为这些技能是理所当然的,但它们使我们非常擅长迁移学习。这就是为什么研究人员可以将芯片布局问题重新定义为一个棋盘游戏,并可以像其他科学家解决围棋游戏一样解决它。

深度加强学习模型可以特别擅长搜索非常大的空间,这是一个物理上不可能对大脑的计算能力。但科学家们面临着比Go更复杂的数量级的问题。“[”[该]在网格上放置1,000个节点的状态空间,具有1,000个细胞的1,000级!(大于102,500),而Go的状态空间为10360.,“研究人员写道。他们想要设计的芯片将由数百万节点组成。

他们解决了复杂性问题人工神经网络可以将芯片设计编码为矢量表示,并使探索问题空间更容易。根据论文,“我们的直觉[重点矿井]是,能够芯片放置的一般任务的策略还应该能够在推理时间内将与新的看不见的芯片相关联的状态编码为有意义的信号。因此,我们培训了一种能够预测新网手册的奖励的神经网络架构,具有使用此架构作为我们政策编码层的最终目标。“

直觉这个词经常被不严格地使用。但这是一个非常复杂而又鲜为人知的过程这涉及到经验、无意识知识、模式识别等等。我们的直觉来自于多年在一个领域的工作,但它们也可以从其他领域的经验中获得。幸运的是,在高性能计算的帮助下,测试这些直觉变得越来越容易机器学习工具

同样值得注意的是,强化学习系统需要设计良好的奖励。事实上,一些科学家认为有正确的奖励功能,强化学习足以达到人工通用智能。然而,如果没有正确的奖励,RL代理可能会陷入无休止的循环中,做一些愚蠢而无意义的事情。在下面的视频中,一个玩《Coast Runners》的RL代理试图最大化自己的积分,并放弃了赢得比赛的主要目标。

谷歌的科学家们将楼层规划系统的奖励设计为“代理线路长度、拥塞和密度的负加权总和”。权值是在强化学习模型开发和训练过程中需要调整的超参数。

通过正确的奖励,加强学习模式能够利用其计算能力,并找到各种方式来设计最大化奖励的平面图。

策划数据集

该系统所采用的深度神经网络采用监督学习.监督机器学习需要标记数据以在培训期间调整模型的参数。谷歌的科学家创造了“10,000芯片展示位置的数据集,其中输入是与给定放置相关的状态,标签是该展示位置的奖励。”

为了避免手工绘制每个楼层平面图,研究人员混合使用了人为设计的平面图和计算机生成的数据。在这篇论文中,并没有太多的信息说明在评估训练数据集中包含的算法生成的示例时,人类付出了多少努力。但是,如果没有高质量的训练数据,监督学习模型最终将做出糟糕的推断。

从这个意义上讲,AI系统与其他强化学习节目(如alphazero)的不同,这在不需要人类投入的情况下开发了其游戏政策。在未来,研究人员可能会开发一个可在无需监督学习组件的情况下设计自己的地板计划的RL代理。但是,我的猜测是,鉴于问题的复杂性,解决这些问题的巨大机会将继续需要人类直觉,机器学习和高性能计算的组合。

强化学习设计vs人性化设计

谷歌的研究人员提出的工作中有趣的方面是芯片的布局。我们人类使用各种捷径来克服我们大脑的极限。我们不可能一下子解决复杂的问题。但我们可以设计模块化的层次系统来划分和克服复杂性。我们思考和设计自顶向下架构的能力在开发能够执行非常复杂任务的系统中发挥了很大的作用。

我将展示软件工程,我自己的专业领域。从理论上讲,您可以在单个文件中的一个非常大,连续的命令流中写整个程序。但软件开发人员永远不会以这种方式编写他们的节目。我们在小块,函数,类,模块中创建软件,可以通过定义良好的接口相互交互。然后,我们将这些部分嵌入更大的碎片并逐渐创建一个组件的层次结构。您不需要阅读程序的每一行以了解它的内容。模块化使多个程序员能够在单个程序上工作和多个程序来重用以前构建的组件。有时,只需查看程序的班级架构就足够了,以指向您的正确方向,找到错误或找到正确的位置添加升级。我们经常贸易速度为模块化和更好的设计。

在计算机芯片的设计中也可以看出这一点。人类设计的芯片往往在不同模块之间有整齐的边界。另一方面,无论布局如何,谷歌的强化学习代理设计的平面图都找到了阻力最小的路径(见下图)。

谷歌AI芯片
右:手动设计芯片左:人工智能芯片

我有兴趣查看这是否将成为未来的可持续设计模式,或者如果它需要在高度优化的机器学习的设计和人工工程施加的自上而下的顺序之间需要某种类型的折衷。

ai +人类智力

正如谷歌的强化学习芯片设计师所展示的,人工智能硬件和软件的创新将继续需要抽象思维,找到解决的正确问题,开发关于解决方案的直觉,并选择合适的数据以验证解决方案。那些是更好的AI芯片可以增强但不更换的技能。

在一天结束时,我认为这不是一个“AI Outsmarting人类”的故事“AI创造了更智能的AI,”或AI发展“递归自我改善“能力。它是人类找到使用AI作为支配的方法的表现形式,以克服自己的认知限制并扩展其能力。如果有一个良性循环,那是一个人和人类找到更好的合作方式。

1评论

留下一个回复

本网站使用AkisMet减少垃圾邮件。了解如何处理您的评论数据