亚博ios彩票监督和无监督机器学习有什么区别?

4.
Starfield数据集群
图片信用:Depositphotos

本文是其中的一部分贬低艾..,一系列帖子(尝试)消除术语术语和神话的神话。

机器学习,教导计算机通过示例和经验进行计www.yabovip4算机执行任务的人工智能子集是研究和开发的热门领域。我们使用日常使用机器学习算法的许多应用程序,包括AI助手,网络搜索和机器翻译。

您的社交媒体新闻源由机器学习算法供电。您在YouTube和Netflix上看到的推荐视频是机器学习模型的结果。Spotify发现每周绘制机器学习算法的力量,以创建符合您喜好的歌曲列表。

但机器学习有许​​多不同的口味。在这篇文章中,我们将探索监督和无监督的学习,这两种主要类别的机器学习算法。每个子集由许多适合各种任务的许多不同算法组成。

关于机器学习非常快的注意事项

在我们潜入监督和无监督的学习之前,让我们有一个缩小的机器学习概述。

今天的人工智能系统以最简单的形式将输入转换为输出。例如,图像分类器将图像或视频帧作为输入,并输出图像中包含的对象类型。欺诈检测算法将支付数据作为交易欺诈的输入和输出概率。一个会下棋的AI将棋盘的当前状态作为输入并输出下一步行动。

经典的开发智能系统的方法,称为象征性的人工智能www.yabovip4,要求程序员明确指定映射到输出的输入的规则。虽然符号ai存在许多好处,但它在输入可以以许多不同的形式出现的字段中使用有限计算机视觉,语音识别,和自然语言处理

相比之下,机器学习使用不同的方法来发展行为。创建ML系统时,开发人员创建一般结构并在许多示例上培训。这些示例可以是与其相应的图像,国际象棋游戏数据,由客户购买的项目,由用户收听的歌曲的图片,或者与AI模型想要解决的问题相关的任何其他数据。在分析培训数据后,机器学习算法调整其内部参数以便能够处理新的输入数据。

监督式学习

物流回归
Logistic回归是一种监督机器学习算法,可以将输入分类为不同的类

如果你关注人工智能新闻,你可www.yabovip4能听说过AI算法需要很多人类标记的例子。这些故事是指监督学习,更受欢迎的机器学习算法类别。

监督机器学习适用于您知道输入数据结果的情况。假设您想创建一个图像分类机学习算法,可以检测猫,狗和马匹的图像。

要培训AI型号,您必须收集猫,狗和马照片的大型数据集。但在将它们馈送到机器学习算法之前,必须使用各个类的名称注释它们。注释可能包括将每个类的图像放在单独的文件夹中,使用文件命名约定,或将元数据附加到图像文件。这是在提及的故事中经常被提及的费力手动任务AI血汗工厂

一旦数据被标记,机器学习算法(如a卷积神经网络或者支持向量机)处理示例并开发一个可以将每个图像映射到其正确类的数学模型。如果AI型号培训有足够的标记示例,则能够准确地检测包含猫,狗,马匹的新图像。

监督机器学习解决了两种问题:分类和回归。以上说明的示例是分类问题,其中机器学习模型必须将输入放入特定的铲斗或类别。分类问题的另一个例子是语音识别。

回归机器学习模型不限于特定类别。它们可以具有连续的,无限的值,例如客户将支付多少产品或明天下雨的可能性。

一些常见的监督学习算法包括以下内容:

  • 线性和逻辑回归
  • 天真贝父
  • 支持向量机
  • 决策树和随机森林
  • 人工神经网络

无人监督的学习

聚类
无监督的机器学习算法可以根据其共享功能将数据分成群集

假设您是一个拥有数千个客户销售记录的电子商务零售企业所有者。你需要找出哪些客户有共同的购买习惯,这样你就可以利用这些信息向他们提出相关的建议,并改进你的追加销售政策。问题是您没有预定义的类别来划分您的客户。因此,你不能训练一个有监督的机器学习模型来分类你的客户。

这是一个聚类问题,主要使用无监督的机器学习。与监督学习不同,无监督机器学习不需要标记数据。它通过训练示例仔细阅读,并将它们分成基于其共享特征的集群。

一个训练有素的无监督机器学习算法会把你的客户划分成相关的集群。这将帮助您根据客户与集群中的其他人的共同偏好来预测客户将购买的产品。

K-means是一种著名的无监督聚类机器学习算法。使用k-means的挑战之一是知道要将数据分成多少个集群。太少的集群将打包不太相似的数据,而太多的集群只会使您的模型复杂和不准确。

除了聚类,无监督的学习还可以减少维度。当您拥有带有太多功能的数据集时,您可以使用维度减少。假设您有一个关于您的客户的信息表,其中有100列。有很多关于您的客户的数据可能会听到有趣。但实际上,它不是。

随着数据中的特征数量的增加,你也需要一个更大的样本集来训练一个准确的机器学习模型。您可能没有足够的样本来训练一个100列的模型。过多的特征也会增加过拟合的机会,这实际上意味着你的AI模型在训练数据上表现良好,但在其他数据上表现不佳。

无监督的机器学习算法可以分析数据并找到不太相关的功能,可以丢弃以简化模型而不会失去有价值的见解。例如,在我们的客户表之后,在通过维度减少算法运行后,我们可能会发现与客户的年龄和家庭地址相关的功能很少,我们可以删除它们。

主成分分析(PCA)是一种流行的降维机器学习算法。

一些安全分析师也使用用于异常检测的无监督机器学习识别组织网络中的恶意活动。

无监督学习的一个好处是,它不需要监督学习必须经历的艰苦数据标签过程。但是,权衡是评估其表现的有效性也很难。相比之下,通过将它们的输出与其测试数据的实际标签进行比较来测量监督学习算法的准确性非常容易。

留下一个回复

本网站使用AkisMet减少垃圾邮件。了解如何处理评论数据