【课程特色】
本次课程对蚂蚁金服竞赛业务背景做了简单介绍,讲述了数据分析在拿到数据之后应该如何开始数据探索,如何跑出模型baseline,如何通过可视化及模型输出进行特征选择,如何理解自定义的评价函数,如何用合理的方式记录上分情况而不发生混乱,如何充分利用传统模型和竞赛杀器,如何根据模型原理进行调参,如何寻找准而不同的模型并做出最 优的机器学习模型融合,以及最终如何将每一步串联到一起拿到最 优模型结果
【招生对象】
有一定基础的学员
【上课时间】
周一到周日9-18点
【学习目标】
大化提升实战能力
取得数据科学竞赛TOP名次
拿到比赛丰厚奖金
斩获名企offer
【课程内容】
01章新手上路
01-01说在前面
01-02初识数据科学竞赛
01-03支付宝欺诈风险识别项目导学
01-04机器学习环境:jupyter使用
01-05机器学习常用库(pandas,scikit-learn)
01-06从业务场景认识比赛数据
01-07数据初探索
01-08快速搭建baseline版本
01-09如何制作线下科学验证体系
01-10比赛常用回归任务评价指标
01-11比赛常用分类任务评价指标
01-12支付宝反欺诈自定义评价函数
01-13数据内存优化技巧
01-14数据交叉验证
01-15使用内置cross_validate接口交叉验证
01-16使用logsitic分类模型
01-17使用KNN分类模型
01-18使用Adaboost分类模型
01-19使用Bagging分类模型
01-20使用RandomRorest分类模型
01-21使用GBDT分类模型
01-21scikit-learn各分类模型对比分析
02章玩转机器学习竞赛两大杀器
02-01LightGBM采用scikit-learn方式调用
02-02LightGBM经典方式调用
02-03LightGBM交叉验证
02-04LightGBM参数解析
02-05LightGBM输出特征重要性
02-06LightGBM高级用法
02-07XGBoost使用
02-08XGBoost参数解析
02-09LightGBM和Xgboost自定义目标函数
02-10XGBoost与LightGBM对比分析
02-11LightGBM原理深度解析
03章数据处理与特征工程中的骚操作
03-01数据探索与处理
03-02数据缺失值分析
03-03缺失值高级处理
03-04特征分析
03-05通过Adversarial训练方式试探训练集和测试集分布
03-06特征的IV和WOE编码
03-07基于模型的特征选择
03-08基于scikit-learn中RFECV的特征选择
03-09使用热力图分析特征相关性
03-10使用核密度图分析特征相关性
03-11类别不平衡分析
03-11类别不平衡分析
03-12基于模型的类别不平衡处理
03-13基于数据采样的类别不平衡处理
03-14灰样本拒绝推断方案
03-15多种方式特征选择
03-16特征分布不均匀的处理策略
03-17困难样本分析
04章模型花式融合调参
04-01网格搜索优化模型参数
04-02贝叶斯方法优化模型参数
04-03机器学习比赛中随机种子的作用
04-04模型的偏差与方差分析
04-05准而不同模型选择策略
04-07stacking的模型融合策略
04-08模型之间的相关性分析
04-09蚂蚁金服项目方案整合
【师资力量】
吴昊天
擅长数据架构、数据分析
教学经验8年
电子科技大学大数据中心
CDA数据分析研究院技术负责人兼高级讲师
赵仁乾
擅长数据架构、数据分析
教学经验7年
北京邮电大学管理科学与工程硕士
北京电信规划设计院
辛立伟
擅长数据架构、数据分析
教学经验20年
CDA数据分析研究院讲师
SUN中国社区会员
【学员风采】
【学习周期】
320课时
【学员评价】
孔同学
统计学和数据挖掘理论是数据分析的基础,常规的统计理论和数据挖掘算法必须要学会,想入行应重点研究,并要学会制作风险评分卡。其他算法了解即可。
董同学
三个月的学习时间。紧凑的课程安排让我感觉每一天都特别充实,白天认真听讲,晚自习巩固复习,每一天都在进步和成长。 我对未来充满了希望。
王同学
CDA的学习经历,给我的人生增添了一段难忘的回忆,也给我在现在的工作中带来了很大的帮助,在今后的工作中要更加努力,不断完善自己。
苏同学
学习是一种态度,在CDA三个月集中学习的过程中,认识了很多同学,也增长了一些校园以外的知识,学习的过程很累很艰辛,却觉得很值得! 痛并快乐着!!
李同学
CDA对于我而言,是一个新生活的起点,经过3个月的奋战,我学习到了许多知识,更结识了许多志同道合的朋友,这是我3个月的学习生活宝贵的财富。
赵同学
首先感谢的是课堂里茫茫多的教授级导师的个人魅力的熏陶,其次就是,三个月持续不断的学习,让我养成一个持续学习的心态和热爱学习的态度。
【机构简介】
如荷学为北京国富如荷网络科技有限公司旗下专注于数字化人才培养及服务的教育品牌,致力于大数据在产、学、研的融合应用。服务百万数字化人才,是全球500强企业的忠实合作伙伴。
如荷学以"培养企业需要的专业数字化人才,搭建弓|领数字化时代的企业人才梯队”为使命,为TD时代数字化人才的数据能力提升及企业数字化转型提供标准化、效率、可落地的数据应用侧解决方案。
【机构环境】
【发展历程】
2006年 开展数据统计、计量实战,学术研究等相关培训视频和现场班
2007年 开展数据统计、数据分析相关培训班
2011年 随着大数据热潮的来临,依托累计上万类共享资料,多年沉淀师资团队,论坛召集多位专家,研发CDA数据分析师体系
2013年CDA数据分析师品牌成立,提供系统化的大数据、数据分析人才培养和认证
2014年 CDA INSTITUTE 成立 ,并推出第 一届全国CDA数据分析师认证考试
2015年第 一届中国数据分析师行业峰会(CDAS)在9月11日成功举办,参会人数逾3000人
2016年 CDA汇聚海内外大数据、数据分析专家上千人,推出就业班、数据科学家训练营、企业内训、CDA俱乐部等多个项目
2017年整合论坛与CDA数据分析师业内资源,形成数据分析领域生态圈,并进一步升级CDA企业内训体系,正式推出大数据实验室
2018年北上广深等多个城市均有校区;拥有200多位专业师资;培养学员超过3万人,每年6月/12月全国28个城市举办CDA认证考试
2019年已举办九届数据分析师认证考试,得到业界广泛认可,学员遍布各大知名企业。人工智能产品“好学AI”问世,引领DT时代新一波技术培训浪潮