导航
  • 报考
  • 备考
  • 政策

报考

备考

复习资料

政策

行业动态

短信预约数据分析师考试动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

数据分析师课|每一个数据分析师都需要看看这个,这是深度解析的机器学习模型

环球网校·2020-01-23 09:30:01浏览12 收藏1
摘要 在茫茫的数据发展长河中,人们慢慢掌握了数据处理的方法,其中重要的处理方法之一就是对数据的分析,所以出现了数据分析师这一处理数据的职业,有很多刚入职成为数据分析师的新人都会有数据分析的问题,今天就来讲讲深度解析的机器学习模型的问题。

1、深度解析的机器学习模型——决策树模型

这个微课程将让你在熟悉以下场景后,构建模型。

你的堂哥已经花了数百万美元用于房地产的预测,由于你对数据科学非常感兴趣,他提供了一个与你进行商业合作对机会。将由他来出资,你来构建模型,预测不同房产的价值。

作为一个专业的挖掘工程师,你咨询了堂哥过去是如何预测房地产价值的。他告诉你都是通过直觉来预测的。但你又问了一些问题,这些疑问表明他已经从过去所见到的房地产中识别出了价格模式,并且他正是用这些模式对他正在考虑的房产进行估值的。

机器学习的工作原理也是这样。我们首先接触一个叫决策树的模型。当然,还有很多出色的模型能够给出更为准确的预测结果。但决策树模型易于理解,并且是数据科学中一些出色模型的基础组成模块。

为了简单起见,我们将从最简单的决策数开始。

这个决策树将所有房子分为两类。所考虑的任何房子的预测价格是该房子所属类别的历史平均价格。

我们用数据来决定如何将所有的房子分为2组,既而决定每个分组中的预测价格。从数据中捕捉模式的这一步就叫拟合或者训练模型。用于模型拟合的数据就叫做训练数据。

模型拟合的细节(包括如何对数据进行切分等),是一个比较复杂的过程,我们把它留到后面来解决。在模型拟合好后,你就可以用它来预测其他房子的价格了。

2、深度解析的机器学习模型——改进的决策树模型

通过拟合训练数据,以下这2棵决策树,哪一个更有可能产生呢?

很显然,左边的第一棵数更有意义一些,因为它捕捉出了这样一个现实:卧室多的房子价格通常要比卧室数少的房子价格高。但这个模型最大的缺陷是它无法捕捉到影响房子价格的多种因素,诸如浴室数、手数(一手还是二手)以及房子的地理位置。

你可以通过一棵拥有更多分支的树来捕获更多的房价影响因素。这种多分支的树被称为更深的树。

通过追踪决策树,你可以预测任何房子价格,只要选择与被预测房子特征相符合路径。房价的预测结果位于树的最底部,树底部用来预测的点,被称为叶子节点。

树的分支和叶子节点的值将由数据来决定,因此是时候来查看一下将要使用的数据了。

以上就是有关于深度解析的机器学习模型的相关内容,以及相应的解析,不论你是已经入职数据分析师岗位的新人,还是打算进入数据分析岗位的小白,以上的内容都或多或少会对大家有所帮助,环球网校的小编在这里祝大家的数据分析师职业道路顺利。

展开剩余
资料下载
历年真题
精选课程
老师直播

注册电脑版

版权所有©环球网校All Rights Reserved