您的岗位    白菜网址大全   民生

科普的机器学习算法,你知道几个?

  • 来源:互联网
  • |
  • 2020-01-14
  • |
  • 0 条评论
  • |
  • |
  • T小字 T大字
  • 落地于1956年之遗传工程,鉴于受到智能算法、计算速度、存储水平等因素的影响,在六十多年之提高历程中经历了多次高潮和低谷。近期几年,受益于数据量的上涨、运算力的升级换代,特别是机器学习新疗法的出现,农技迎来了大爆发的年月。

    提起机器学习这个词时,一部分人第一想到的可能性是科幻电影里之机器人。事实上,机器学习是一门多世界交叉学科,涉及概率论、热学、书法复杂度理论等多门科目。唯一研究计算机如何模拟或促成人类的读书行为,采取数据或以往的经历,本条优化计算机程序的特性标准。

    根据学习任务的不同,咱可以将机器学习分为监督学习、非监督学习、深化学习三种类型,而每种类型又对应着一些算法。

    各族算法以及对应的天职类型

    然后就简单介绍几种可用的机器学习算法及其应用场景,穿过资本篇文章大家可以对机器学习的商用算法有个纲领性的认识。

    一、监督学习

    (1)支持向量机(Support Vector Machine,SVM):是一类按监督学习方法对数据进行二元分类的狭义线性分类器,伊决策边界是对读书样本求解的最大边距超平面。例如,在纸上有两类线性可分的线,支持向量机会寻找一枝直线将这两类点区分开来,并且与那些点的距离都尽可能远。

    优点:泛化错误率低,结果易解释。

    症结:对广大训练样本难以实施,消灭多分类问题存在困难,对参数调节和核函数的取舍敏感。

    使用场景:文本分类、人像识别、西医诊断等。

    (2)决定树(Decision Tree):是一番预测模型,代表的是对象属性与目标值期间的一种映射关系。下图是如何在决定树中建模的简易示例:

    优点:轻而易举掌握和解释,可以可视化分析,轻而易举提取出规则;能够处理不相关的特征。

    症结:对缺失数据处理比较困难。

    使用场景:在决定过程应用较多。

    (3)节能贝叶斯分列(Naive Bayesian classification):对于给出的待分类项,求解此项出现的尺度下各个门类出现的概率,谁最大,就以为此待分类属于哪个类别。贝叶斯公式为:p(A|B)= p(B|A)*p(A/p(B),其中P(A|B)表示后验概率,P(B|A)是似然值,P(A)是类别的先验概率,P(B)代表预测器的先验概率。

    优点:在数量较少的情况下仍然有效,可以处理多类别问题。

    症结:对输入数据的准备方式较为敏感。

    使用场景:文本分类、面识别、欺诈检测。

    (4)k-近邻算法(K-Nearest Neighbor,KNN):是一种基于实例的读书,采取测量不同特征值之间的距离方法进行分类。伊核心思路是:给定一个训练样本集,接下来输入没有标签的新数据,名将新数据的每股特征与样本集中数据对应的特性进行比较,找到最邻近的k个(一般是不大于20的整数)老,这k个规矩的大部分属于某个类,就把该输入实例分类到这个类中。

    优点:概括、轻而易举掌握、轻而易举实现,不要估计参数。另外,与朴素贝叶斯等等的解法比,产业化多少输入假定、强度高、对特殊数据值不敏感。

    症结:对于训练数据依赖程度比较大,并且缺少训练阶段,无法应对多样资产。

    使用场景:字符识别、文本分类、图像识别等世界。

    二、非监督学习

    (1)东成分分析(Principal Component Analysis,PCA):是一种统计方法。伊根本考虑是将n维特征映射到k维上,这k维是全新的正交特征也把称为主成分,是在原来n维特征的基础上重新构造出来的k维特征。

    优点:降低数据的复杂,辨认最重要的多个性状。

    症结:东成分各个特征维度的意义具有原则性的模糊性,不如原始样本特征的诠释性强;有可能损失有用之消息。

    使用场景:语音、图像、打电话的剖析处理。

    (2)奇异值分解(Singular Value Decomposition,SVD):可以将一个比较复杂的矩阵用更小更简单的几个子矩阵的相乘来表示,那些小矩阵描述的是矩阵的重中之重的特征。

    优点:规范化数据,除去噪声点,增长算法的结果。

    症结:数量的更换可能难以理解。

    使用场景:引进系统、图表压缩等。

    (3)K-价值聚类(K-Means):是一种迭代求解的聚类分析算法,采取距离作为相似性指标。伊工作流程是随机确定K个目标作为初始的聚类中心,接下来计算每个对象与各国种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。

    优点:书法简单容易实现。

    症结:可能收敛到一些最小值,在周边数据集上收敛较慢。

    使用场景:图像处理、数据分析以及市场研究等。

    三、深化学习

    Q-learning:是一番基于值的深化学习算法,他根据动作值函数评估应该选择哪个动作,本条函数决定了处于某一个特定状态以及在该状态下利用特定动作的奖赏价值。

    优点:可以接受更广阔的数目范围。

    症结:缺乏通用性。

    使用场景:游戏开发。

    上述就是文章的全方位内容,相信大家对常用的机器学习算法应该有了大致的询问。

    现在,咱越来越多步看看机器学习算法为人类带来的求实价值,如它们提供了主要的表现力和信息来报告战略决策。可以确认的是,随着机器学习越来越流行,前途还将出现越来越多能很好地处理任务的解法。

    免责声明:成本站所有信息均搜集自互联网,并不代表本站观点,成本站不对伊实际合法性负责。如有消息侵犯了您的回旋,请告诉,成本站将立刻处理。沟通QQ:1640731186
  • 标签:
  • 编纂:孙世力
  • 相关文章
  • 友荐云推荐