深度强化学习帮助我们掌握复杂性

4

由Chris Nicholson.

深度加强学习 - 通过测试其行动的后果来学习机器 - 是人工智能最有希望和最有效的领域之一。www.yabovip4它结合了深神经网络强化学习,可以培训一起培训,以实现多种步骤的目标。它是自动驾驶车辆和工业机器人的关键部分,必须安全地及时浏览复杂的环境。

最多机器学习算法它们擅长一秒钟之内就能完成的感知任务,比如识别声音或面孔。但深度强化学习可以学习动作的战术序列,比如赢得棋盘游戏或递送包裹。

那些战术序列更接近我们对实际智能行为的想法。如果我们说某人聪明,我们很少意味着他们可以识别面孔。我们经常意味着他们知道该怎么做才能达到目标。像协变和AMBI机器人这样的初创公司正在使用加强学习来控制机器人武器,而汽车制造商喜欢特斯拉用它来帮助转向他们的车辆

转向系统复杂性

尽可能令人印象深刻,加强学习可以多于控制各种机器。它可以指导机器的整个管弦乐队,转向复杂的系统,以更好的性能,路线舰队和协调机器人团队。

复杂理论描述了具有许多互锁部分的更换系统,这些部分基于对其输入的小变化产生令人惊讶的结果(思考飓风的蝴蝶效应)。在这个理论中,有一些叫做的东西行为.当系统中的许多小组件将自己组织成更大的东西时,行为就出现了,在更大的规模上形成一个可感知的模式。飓风、蚁群和鸟群都是小单位自我组织成更强大的东西的好例子。

通过深度加强学习,机器人和自主车辆在较大的复杂系统中表现出紧急行为,例如交通或全球供应链。也就是说,这些机器开始表现为团队,即使他们从未明确指导这样做。通过培训,他们了解团队合作会导致更好的结果。在一个工厂中,这可能意味着一个AGV机器人牺牲自己的速度,以便允许更高优先的有效载荷通过,从而提高了系统的整体吞吐量。

很长一段时间,复杂性理论是有趣的,但难以采取行动。深度加强学习使复杂性理论可操作,因为它允许我们创造和引导紧急行为。它允许我们抓住太大的系统,以完全理解。深度加强学习是复杂的基因工程是进化:杠杆和加速。

人类似乎需要一点杠杆和加速。事件的匆忙使它看起来像我们所生活的复杂系统就是螺旋地失控。深增强学习将其中一些人带回我们的掌握中。

处理外部冲击和可变数据

大多数决策系统都有在数据中意外转移的问题.他们接受的训练是在某些情况下做出决定,当意外发生时,他们就会崩溃。他们是脆弱的。深度强化学习能够以一种一般化的方式对可变数据和不可预见事件作出反应。这样做的一个原因是,在模拟中,您可以针对以前从未发生过的事件进行训练,这些事件也没有出现在历史数据中。仿真在帮助制造业将自动机器人和车辆从测试带到真实场景中发挥了重要作用。

强化学习适应现在正在发生的事情,并且可以快速更新其对其运行的环境的期望和理解。这意味着AI驱动的优化和决策可以应用于以前无法解决的许多新问题。这意味着我们将能够使我们的机器更聪明,在我们依靠脆弱的规则和胆量本能之前。

掌握供应链的复杂性

强化学习对不可预见事件的反应能力使其作为现代供应链问题的解决方案变得越来越有趣。就在去年,全球和国家供应链受到的外部冲击包括COVID-19、经济封锁、地缘政治僵局、极端天气事件(德克萨斯州的风暴),以及一艘20万吨的船只堵塞苏伊士运河。世界经济尚未复苏。

供应链——从上游的工厂开始,经过港口、铁路调车场和仓库,到零售终端——是一个庞大而复杂的系统。这些系统需要具有适应性,但新闻告诉我们它们并非如此。

一个用例,深度加强学习可以有助于能源消耗,可以通过帮助我们产生更加干净和可再生能源的气候变化,更有效地在供应链中更有效地消耗这种能量。

能量网格只是供电的供应链。但是,可再生动力源的可能性比传统更具可变性,因为它们的产出取决于天气。

深度加固学习可以进入更好的决策进入无人机和机器人,维修船员抚养太阳能农场。它有助于在发电厂设定纺纱,补充储备和备用供应计划,以及使用更可变的可再生能源的平衡化石燃料。它可以校准在分布式系统中在家中生成,存储和消耗的可再生能源,降低网格上的负载。它可以帮助能量密集型工厂预测和先发制人地对电力价格飙升起诉。

类似形式的系统控制可以应用于农业,机器人正在喂养牲畜和收获作物并补偿劳动力短缺,以及采矿地点,而自主运输卡车比在乘用车世界中更重要,因为他们运行-高速公路。通过降低燃料和劳动力成本,完全自主牵引卡车和钻探系统正在创造新的效率,以及使操作更安全。

综上所述,深度强化学习不仅仅是智能机器人的智能核心,它还能够充当更大系统的控制塔,这是当今社会面临的关键问题之一。通过大规模学习机器团队的紧急行为,深度强化学习可以帮助我们适应更大的、系统性的变化,以保持我们的系统工作。这一点很重要,因为我们现有的制造和运输货物的系统庞大、相互关联、脆弱,使它们更加坚固是未来几年的关键挑战。

关于作者

克里斯·尼科尔森是创始人兼首席执行官途径,AI启动,适用深增强学习以供应链和工业操作。

发表评论

本网站使用AkisMet减少垃圾邮件。了解如何处理评论数据