【课程简介】
企业想要在竞争激烈的市场中胜出,决策的速度和反应的效率尤为重要。根据调查显示,75%的企业在面临拟定策略时,常常无法获得实时且有根据的决策信息。什么样的数据、要透过什么样的方法,才能快速且实时的转变成决策时有用的信息,是现代企业所面临最迫切性的问题。
Python数据分析集训课程针对针对周末时间充裕、零基础的专科、本科在校生,以及在职&欲转行从事数据分析的工作人员提供3个月非脱产周末集训,毕业可推荐相关工作。
课程内容以CDA数据分析师标准大纲要求,包含Python基础 – Pandas数据清洗 - Python爬虫 - Python数据可视化(Matplotlib、Seaborn、Pyecharts) - Python机器学习算法等内容,并结合互联网保险、电信、银行、医疗、交通等行业实际案例来帮助学员建立整套的数据分析和机器学习思路,案例涉及营销优化、风险控制、用户研究、商业部署等领域,使学员所学更符合企业要求。
【师资力量】
倪向洋
CDA数据分析研究院资深讲师
CDA数据科学研究院大数据、python课程讲师,CDA命题委员会成员。曾经就职 于IBM,有丰富的运维工作和大数据平台搭建经验。目前担任CDA大数据课程以 及数据分析课程讲师,主要负责大数据平台搭建,利用机器学习对数据做清洗与 分析的工作。擅长将机器学习,自动化运维与分析技术。
李御玺
台湾铭传大学教授/中华数据挖掘协会理事
台湾大学博士,在其相关研究领域已发表超过260篇以上的研究论文,同时也是国科会与教育部多个相关研究计划的主持人。 其还兼任厦门大学数据挖掘中心顾问,中国人民大学数据挖掘中心顾问,IBM SPSS-China顾问。服务过的客户包括:中国工商局、中信银行、台新银行等。
彭奕伟
CDA数据科学研究院Python课程讲师
拥有5年的金融行业数据挖掘经验。先后参与民生银行卡移动支付项目研发,银行人工智能客服服务系统项目。
【学习目标】
熟练掌握数据科学领域最 受欢迎的编程语言-Python
掌握使用Python和pandas库进行数据清洗和预处理
使用Python爬虫获取网络数据
学会使用matplotlib、seaborn进行初级可视化
学会使用Pyecharts进行高级数据可视化
学会构建机器学习算法进行分类、预测和聚类模型
使用Python进行数据分析整体思路、针对业务做出模型最 优化选择
善用机器学习解决用户画像、精准营销、风险管理等商业问题
使用机器学习实操电商、电信、医药行业真实项目案例
【课程内容】
1章Python基础
1-1准备工作-Python开发环境配置
1-2Python标准数据类型
1-3控制流语句
1-4异常和错误(穿插在其他内容中讲)
1-5文件操作
2章Python进行数据整理和数据清洗
2-1Python标准库简介
2-2Numpy数组基础
2-3Pandas对象基础
3章python数据可视化(线上)
3-1绘图思想的基本原理
3-2Python数据可视化包-Matplotlib介绍
3-3使用Python数据处理包Pandas做可视化
3-4Python数据可视化包-Seaborn介绍与图形绘制
3-5Python数据可视化包-Pyecharts介绍与图形绘制
4章Python爬虫(线上)
4-1网络爬虫基础知识
4-2网络请求及响应-requests库
4-3HTML文档解析-BeautifulSoup库
4-4常见反爬虫机制及应对
4-5网络爬虫 VS 网络数据抓取
4-6实战一:批量下载头像
4-7实战二:抓取豆瓣书籍简介
4-8实战三:模拟浏览器selenium抓取电商商品信息及评论
5章Python数据清洗高级操作及案例实战
5-1数据的获取与存储
5-2数据探索
5-3数据清洗思维
5-4数据清洗实战案例一:泰坦尼克幸存者数据清洗(根据实际上课情况调整数据集)
5-5数据清洗实战案例二:USDA食品数据清洗(根据实际上课情况调整数据集)
6章Python编程考试(线上)
6-1Python基础部分
6-2Python数据清洗的实现
7章机器学习算法
7-1准备工作:开发环境配置(以文档的形式给出)
7-2机器学习入门介绍:
7-3scikit-learn入门:Scikit-Learn库简介
7-4KNN-最近邻分类算法:原理、实现
7-5决策树算法:原理、实现、相关技术应用及实例
7-6随机森林算法:原理、实现及相关技术应用:以乳腺癌预测为例
7-7K-Means聚类算法:原理、实现及簇选择与矢量化应用
7-8关联规则算法:原理、实现
7-9线性回归
7-10逻辑回归
7-11SVM支持向量机
7-12分类模型的评估指标(续)
7-13朴素贝叶斯算法
8章电商案例
8-1分析目标:
8-2基于国外大型电商用户购买信息数据的客户购买预测模型构建流程:
9章金融案例
9-1分析目标:
9-2基于大型金融公司的客户贷款信息,构建用户信用评分卡模型的建模步骤:
【招生对象】
想从事数据领域工作,缺乏实践技能的在校学生
希望转行数据领域人员
个人发展遭遇瓶颈的数据分析师
有数据化运营需求的产品运营、市场人员及管理者
对Python数据分析和挖掘感兴趣的业界人士
【授课方式】
远程+面授
【上课时间】
周末8-17点
【学员风采】
【发展历程】
2006年 开展数据统计、计量实战,学术研究等相关培训视频和现场班
2007年 开展数据统计、数据分析相关培训班
2011年 随着大数据热潮的来临,依托累计上万类共享资料,多年沉淀师资团队,论坛召集多位专家,研发CDA数据分析师体系
2013年CDA数据分析师品牌成立,提供系统化的大数据、数据分析人才培养和认证
2014年 CDA INSTITUTE 成立 ,并推出第 一届全国CDA数据分析师认证考试
2015年第 一届中国数据分析师行业峰会(CDAS)在9月11日成功举办,参会人数逾3000人
2016年 CDA汇聚海内外大数据、数据分析专家上千人,推出就业班、数据科学家训练营、企业内训、CDA俱乐部等多个项目
2017年整合论坛与CDA数据分析师业内资源,形成数据分析领域生态圈,并进一步升级CDA企业内训体系,正式推出大数据实验室
2018年北上广深等多个城市均有校区;拥有200多位专业师资;培养学员超过3万人,每年6月/12月全国28个城市举办CDA认证考试
2019年已举办九届数据分析师认证考试,得到业界广泛认可,学员遍布各大知名企业。人工智能产品“好学AI”问世,引领DT时代新一波技术培训浪潮
【机构简介】
如荷学为北京国富如荷网络科技有限公司旗下专注于数字化人才培养及服务的教育品牌,致力于大数据在产、学、研的融合应用。服务百万数字化人才,是全球500强企业的忠实合作伙伴。
如荷学以"培养企业需要的专业数字化人才,搭建弓|领数字化时代的企业人才梯队”为使命,为TD时代数字化人才的数据能力提升及企业数字化转型提供标准化、效率、可落地的数据应用侧解决方案。
【机构环境】
【学员评价】
孔同学
统计学和数据挖掘理论是数据分析的基础,常规的统计理论和数据挖掘算法必须要学会,想入行应重点研究,并要学会制作风险评分卡。其他算法了解即可。
董同学
三个月的学习时间。紧凑的课程安排让我感觉每一天都特别充实,白天认真听讲,晚自习巩固复习,每一天都在进步和成长。 我对未来充满了希望。
王同学
CDA的学习经历,给我的人生增添了一段难忘的回忆,也给我在现在的工作中带来了很大的帮助,在今后的工作中要更加努力,不断完善自己。
苏同学
学习是一种态度,在CDA三个月集中学习的过程中,认识了很多同学,也增长了一些校园以外的知识,学习的过程很累很艰辛,却觉得很值得! 痛并快乐着!!
李同学
CDA对于我而言,是一个新生活的起点,经过3个月的奋战,我学习到了许多知识,更结识了许多志同道合的朋友,这是我3个月的学习生活宝贵的财富。
赵同学
首先感谢的是课堂里茫茫多的教授级导师的个人魅力的熏陶,其次就是,三个月持续不断的学习,让我养成一个持续学习的心态和热爱学习的态度。