• 全国 [切换]
  • 二维码
    早勤网

    手机WAP版

    手机也能找商机,信息同步6大终端平台!

    微信小程序

    微信公众号

    当前位置: 首页 » 行业新闻 » 热点新闻 » 正文

    数据分析经典案例重现:使用DataWorks Notebook 实现Kaggle竞赛之房价预测,成为数据分析大神!

    放大字体  缩小字体 发布日期:2021-07-20 01:33:44   浏览次数:115  发布人:7960****  IP:124.223.189***  评论:0
    导读

    在当今数据驱动的时代,数据分析和机器学习技术在各个领域中发挥着越来越重要的作用。其中,房价预测是一个典型的应用场景,不仅在房地产行业中具有重要价值,而且也是许多数据科学家和机器学习爱好者热衷研究的课题。Kaggle作为一个全球知名的数据科学竞赛平台,其举办的房价预测竞赛更是成为了数据分析领域的经典案例之一。DataWorks作为一站式智能数据开发与治理平台,基于DataWorks Notebook

    在当今数据驱动的时代,数据分析和机器学习技术在各个领域中发挥着越来越重要的作用。其中,房价预测是一个典型的应用场景,不仅在房地产行业中具有重要价值,而且也是许多数据科学家和机器学习爱好者热衷研究的课题。Kaggle作为一个全球知名的数据科学竞赛平台,其举办的房价预测竞赛更是成为了数据分析领域的经典案例之一。DataWorks作为一站式智能数据开发与治理平台,基于DataWorks Notebook可完成完成数据加载、数据探索、数据可视化、数据清洗、特征分析、特征处理、机器学习、回归预测等步骤,实现Kaggle竞赛中的房价预测。

    操作步骤如下:







    步骤一:开通DataWorks产品

    1. 使用阿里云主账号或具有AliyunBSSOrderAccessAliyunDataWorksFullAccess权限策略的RAM用户/RAM角色登录阿里云控制台。
    2. 进入DataWorks组合购买页面,通过配置如下信息完成DataWorks版本按量付费通用型资源组的免费开通:
      1. 地域:选择目标地域
      2. DataWorks版本:
        1. 版本:选择基础版
        2. 购买时长:3个月,另可按需勾选到期自动续费





    1. DataWorks资源组:
    • 资源组名称:默认名称为dataworks_default_resource_grc,可自定义修改
    • 专有网络(VPC):选择目标VPC
    • 交换机(V-Switch):选择目标V-Switch
      其他信息保持默认设置即可。





    1. 进入DataWorks通用型资源组抵扣包购买页面,通过配置如下信息完成购买,预计花费105元(150元):
    • 流量包容量规格:300CUH*
    • 适用区域:中国内地公共云通用
    • 购买数量:1
    • 订购有效期:请在3个月内用完,过期作废

    DataWorks通用型资源组抵扣包可用于:个人开发环境、数据计算、数据集成、数据服务。






    步骤二:创建DataWorks工作空间

    1. 使用阿里云主账号或具有CreateWorkspace权限策略的RAM用户/RAM角色登录阿里云控制台。
    2. 进入DataWorks控制台 > 工作空间列表,点击创建工作空间按钮。
    3. 在创建工作空间页面,填写工作空间所需信息:
    • 工作空间名称:自定义名称
    • 参加数据开发(DataStudio)(新版)公测:开关置为开启
    • 默认资源组配置:选择步骤一中开通的DataWorks通用型资源组名称

    其它信息保持默认设置即可。






    1. 点击页面左下角的创建工作空间按钮。
    2. 对新建的工作空间,按需绑定计算资源和数据目录,或直接跳过。

    步骤三:新建个人开发环境实例

    1. 进入新版数据开发(DataStudio)页面,在页面顶部切换工作空间名称至步骤二中创建的工作空间名称。
    2. 在页面顶部的个人开发环境的下拉框中,点击前往新建





    1. 填写个人开发环境实例所需的信息:
    • 实例名称:自定义个人开发环境实例名称
    • 资源组:选择步骤一中开通的按量付费的DataWorks通用型资源组
    • 资源配额:自定义选择资源配额,例如:2CU
      其它信息保持默认设置即可。





    1. 点击确定,等待个人开发环境实例启动。

    步骤四:导入Notebook案例

    1. 在欢迎页中,点击DataWorks Gallery,进入Notebook案例列表。





    1. 选择目标Notebook案例(数据分析经典案例:Kaggle竞赛之房价预测),点击载入案例。
    2. 选择步骤三中新建的个人开发环境实例名称后,点击确认,进入选择在新版数据开发(Data Studio)页面。
    3. 进入Notebook案例,按照案例的详细指导步骤进行编辑和运行。

    注意:为防止抵扣包资源的容量额度持续被扣除,当不需要开发和分析时,请及时在新版数据开发页>个人开发环境>管理环境中,手动点击停止

     
    (文/匿名(若涉版权问题请联系我们核实发布者) / 非法信息举报 / 删稿)
    打赏
    免责声明
    • 
    本文为昵称为 7960**** 发布的作品,本文仅代表发布者个人观点,本站未对其内容进行核实,请读者仅做参考,如若文中涉及有违公德、触犯法律的内容,一经发现,立即删除,发布者需自行承担相应责任。涉及到版权或其他问题,请及时联系我们154208694@qq.com删除,我们积极做(权利人与发布者之间的调停者)中立处理。郑重说明:不 违规举报 视为放弃权利,本站不承担任何责任!
    有个别老鼠屎以营利为目的遇到侵权情况但不联系本站或自己发布违规信息然后直接向本站索取高额赔偿等情况,本站一概以诈骗报警处理,曾经有1例诈骗分子已经绳之以法,本站本着公平公正的原则,若遇 违规举报 我们100%在3个工作日内处理!
    0相关评论
     

    (c)2008-现在 zaoqin.com All Rights Reserved.