三张图读懂机器学习 :基本概念、五大流派与九种常见算法

  • 时间:
  • 浏览:1

7. 循环神经网络(Recurrent neural network):在任意神经网络中,每个神经元都通过 1 个或多个隐藏层来将某些某些输入转再加单个输出。循环神经网络(RNN)会将值进一步逐层传递,让逐层学习成为机会。换句话说,RNN 趋于稳定并都有形式的记忆,允许先前的输出去影响上边的输入。

主导流派:联结主义+符号主义+贝叶斯+……

4. 机器学习趋于稳定的位置

场景举例:新闻分类、手写识别。

架构:云计算和雾计算

①传统编程:软件工程师编写应用应用程序来补救问题。首先趋于稳定某些数据→为了补救多少问题,软件工程师编写多少流程来告诉机器应该要怎样做→计算机遵照这些流程执行,但会 得出结果;

快速三维地图测绘和建模:要建造一架铁路桥,PwC 的数据科学家和领域专家将机器学习应用到了无人机采集到的数据上。这些组合实现了工作成功中的精准监控和快速反馈。

二、机器学习的演化

优点:擅长对人、地点、事物的一系列不同价值形式、品质、价值形式进行评估

场景举例:基于规则的信用评估、赛马结果预测

④智能应用:智能应用使用人工智能所得到的结果,如图是多少精准农业的应用案例示意,该应用基于无人机所采集到的数据。

主导理论:记忆神经网络、大规模集成、基于知识的推理

主导流派:联结主义+符号主义

主导理论:神经科学和概率

优点:对于在小数据集上有显著价值形式的相关对象,朴素贝叶斯土最好的办法可对其进行快速分类

4. 朴素贝叶斯分类(Naive Bayes Classification):朴素贝叶斯分类器用于计算机会条件的分支概率。每个独立的价值形式都有「朴素」或条件独立的,但会 它们不需要影响别的对象。相似,在多少装有共 5 个黄色和红色小球的罐子里,连续拿到多少黄色小球的概率是多少?从图中最上边分支可见,前后抓取多少黄色小球的概率为 1/10。朴素贝叶斯分类器都时要计算多个价值形式的联合条件概率。

2010 年代早期到中期

场景举例:自然语言补救、翻译

场景举例:面部表情分析、气象预测

本文来自云栖社区相互公司合作 伙伴“ 数据与算法之美”,了解相关信息都时要关注“superdata1”微信公众号

1. 决策树(Decision Tree):在进行逐步应答过程中,典型的决策树分析会使用分层变量或决策节点,相似,可将多少给定用户分类成信用可靠或不可靠。

一、机器学习概览

2040 年代+

场景举例:用户流失分析、风险评估

①选择数据:将你的数据分成三组:训练数据、验证数据和测试数据;

优点:容许数据的变化性,适用于识别(recognition)和预测操作

来源:机器之心

主导流派:算法融合

简单的问答:范围狭窄的、领域特定的知识共享

增强分析以降低风险:为了检测内部交易,PwC 将机器学习和其它分析技术结合了起来,从而开发了更为全面的用户概况,但会 获得了对复杂性可疑行为的更厚度了解。

2. 机器学习和人工智能的关系

②模型数据:使用训练数据来构建使用相关价值形式的模型;

架构:服务器或大型机

主导流派:符号主义

主导理论:最佳组合的元学习

主导理论:感知的以后有网络,推理和工作的以后有规则

机器学习有某些某些应用场景,这里给出了某些示例,我应该 要怎样使用它?

3. 这些流派有望相互公司合作 ,并将每所有人的土最好的办法融合到同時

场景举例:路面交通流量分析、邮件过滤

优点:当趋于稳定非常大型的数据集、几瓶价值形式和复杂性的分类任务时,卷积神经网络是非常有用的

场景举例:爱情分析、消费者分类

2020 年代+

②统计学:分析师比较变量之间的关系;

基本决策逻辑:决策支持系统,实用性有限

④进化主义:生成变化,但会 为特定目标获取其中最优的,最喜欢的算法是:遗传算法;

5. 机器学习的实际应用

⑤使用模型:使用完全训练好的模型在新数据上做预测;

⑥调优模型:使用更多数据、不同的价值形式或调整过的参数来提升算法的性能表现。

③联结主义:使用概率矩阵和加权神经元来动态地识别和归纳模式,最喜欢的算法是:神经网络;

③验证模型:使用你的验证数据接入你的模型;

5. 隐马尔可夫模型(Hidden Markov model):显马尔可夫过程是完全选择性的——多少给定的状态多少劲会伴随原来 状态。交通信号灯某些某些 多少例子。相反,隐马尔可夫模型通过分析可见数据来计算隐藏状态的趋于稳定。以后 ,借助隐藏状态分析,隐马尔可夫模型都时要估计机会的未来观察模式。在本例中,高或低气压的概率(这是隐藏状态)可用于预测晴天、雨天、多云天的概率。

1. 五大流派

简单感知、推理和行动:有限制的自动化或人机交互

2010 年代末期

②贝叶斯派:获取趋于稳定的机会性来进行概率推理,最喜欢的算法是:朴素贝叶斯或马尔可夫;

预测表现最佳的目标:PwC 使用机器学习和其它分析土最好的办法来评估 Melbourne Cup 赛场上不同赛马的潜力。

架构:某些云

④测试模型:使用你的测试数据检查被验证的模型的表现;

版权归原作者所有,转载仅供学习使用,不需要于任何商业用途,如有侵权请留言联系删除,感谢相互公司合作 。

原文发布时间为:2018-12-5

几十年来,人工智能研究者的各个「部落」多少劲以来都有彼此争夺主导权。现在是这些部落联合起来的以后多会儿?某些人也机会不得不原来 做,机会相互公司合作 和算法融合是实现真正通用人工智能(AGI)的唯一土最好的办法。这里给出了机器学习土最好的办法的演化之路以及未来的机会模样。推荐阅读《图解机器学习》

场景举例:图像分类与字幕再加、政治爱情分析

优点:回归可用于识别变量之间的连续关系,即便这些关系都有非常明显

9. 卷积神经网络(convolutional neural network):卷积是指来自后续层的权重的融合,可用于标记输出层。

6. 随机森林(Random forest):随机森林算法通过使用多个涵盖随机选择的数据子集的树(tree)改善了决策树的精确性。本例在基因表达层面上考察了几瓶与乳腺癌复发相关的基因,并计算出复发风险。

优点:循环神经网络在趋于稳定几瓶有序信息时具有预测能力

主导理论:知识工程

架构:小型服务器集群

识别:更加精准的图像和声音识别、翻译、情绪分析等

机器学习是并都有重在寻找数据中的模式并使用这些模式来做出预测的研究和算法的门类。机器学习是人工智能领域的一要素,但会 和知识发现与数据挖掘有所交集。

主导理论:概率论

③机器学习:数据科学家使用训练数据集来教计算机应该要怎样做,但会 系统执行该任务。首先趋于稳定大数据→机器会学习使用训练数据集来进行分类,调节特定的算法来实现目标分类→该计算机可学习识别数据中的关系、趋势和模式;

机器学习正在进步,某些人似乎正在不断接近某些人心中的人工智能目标。语音识别、图像检测、机器翻译、风格迁移等技术机会在某些人的实际生活中开使了了得到了应用,但机器学习的发展仍还在继续,甚至被认为有机会彻底改变人类文明的发展方向乃至人类自身。

优点:长短期记忆和门控循环单元神经网络具备与其它循环神经网络一样的优点,但机会它们有更好的记忆能力,某些某些更常被使用

主导流派:联结主义

⑤Analogizer:根据约束条件来优化函数(尽机会走到更高,但同時 越多遗弃道路),最喜欢的算法是:支持向量机。

感知和响应:基于通越多种学习土最好的办法获得的知识或经验采取行动或做出回答

1. 这些是机器学习?

主导流派:贝叶斯

3. 机器学习的工作土最好的办法

19100 年代

优点:支持向量机擅长在变量 X 与其它变量之间进行二元分类操作,无论其关系否有有是线性的

优点:随机森林土最好的办法被证明对大规模数据集和趋于稳定几瓶且有时不相关价值形式的项(item)来说很有用

场景举例:图像识别、文本转语音、药物发现

但你了解现在正在趋于稳定的这场变革吗?四大会计师事务所之一的普华永道(PwC)近日发布了多份解读机器学习基础的图表,其中介绍了机器学习的基本概念、原理、历史、未来趋势和某些常见的算法。为便于读者阅读,机器之心对这些图表进行了编译和拆分,分三大要素对这些内容进行了呈现,希望能帮助你进一步阅读。

①符号主义:使用符号、规则和逻辑来表征知识和进行逻辑推理,最喜欢的算法是:规则和决策树;

架构:无处沒有的服务器

3. 回归(Regression):回归都时要勾画出因变量与多少或多个因变量之间的状态关系。在这些例子中,将垃圾邮件和非垃圾邮件进行了区分。

本文作者:数据与算法之美

三、机器学习的算法

8. 长短期记忆(Long short-term memory,LSTM)与门控循环单元神经网络(gated recurrent unit nerual network):早期的 RNN 形式是会趋于稳定损耗的。尽管这些早期循环神经网络只允许留存几瓶的早期信息,新近的长短期记忆(LSTM)与门控循环单元(GRU)神经网络都有长期与短期的记忆。换句话说,这些新近的 RNN 拥有更好的控制记忆的能力,允许保留早先的值或是当有必要补救某些某些系列步骤时重置这些值,这补救了「梯度衰减」或逐层传递的值的最终 degradation。LSTM 与 GRU 网络使得某些人都时要使用被称为「门(gate)」的记忆模块或价值形式来控制记忆,这些门都时要在共要的以后传递或重置值。

1990 年代到 100 年

2. 演化的阶段

你应该使用哪种机器学习算法?这在很大程度上依赖于可用数据的性质和数量以及每多少特定用例中你的训练目标。越多使用最复杂性的算法,除非其结果值得付出昂贵的开销和资源。这里给出了某些最常见的算法,按使用简单程度排序。

分类:可扩展的比较或对比,对某些任务都足够好了

机器通过分析几瓶数据来进行学习。比如说,不时要通过编程来识别猫或人脸,它们都时要通过使用图片来进行训练,从而归纳和识别特定的目标。

2. 支持向量机(Support Vector Machine):基于超平面(hyperplane),支持向量机都时要对数据群进行分类。

架构:大型服务器农场