晓鹿
优酷职工
无论你想从事的是金融、管理、战投、还是政府工作,想要融入一个“数据”为上的时代,你的头衔都需要添加一个“数据分析师”。Python不仅具有强大的数据分析功能,又是最接近人工智能的语言,本课程将帮助你掌握最核心的Python数据分析技能,完成15个实战项目,成为优秀的数据分析师!
城市数据团和网易课程团队将共同带领大家,在最短时间内掌握最核心的Python数据分析技能,完成15个实战项目,梳理网易和硅谷的实战案例,陪伴大家成为一名优秀的数据分析师!
1、未来准备从事数据挖掘相关工作的大学生人群;
2、媒体、零售、金融、信息、互联网等业务人员;
3、数据挖掘岗位转型、提拔涨薪、技能优化等的职场白领;
4、希望学习Python数据分析技能的初学者;
5、希望深入了解大数据行业应用的企业负责人;
6、每一位数据爱好者。
本门课程作为数据分析师微专业的开篇导论,将会以数据思路拓展为主,讲解 “城市数据团” 在数据媒体、产品算法、数据咨询研究中的经典案例;以及网易团队........,让学员了解数据能做什么,以及构建对数据分析和数据挖掘的基本概念,补充完善一个系统技术方法论的认知。同时在微专业开展的第一周,我们会指导大家完成课程的前期准备工作,包括python环境设置、相关软件安装等。
课程核心关键字:用数据认识世界、为什么选择python作为技术平台?一个数据分析师需要具备什么样的技能。
第一章 数据能做什么?
1.1 优秀数据分析师的三个特征
1.2 避免对数据可视化的误解
1.3 机器学习是什么?
1.4 用数据改变未来
第二章 课前入门指南
2.1 软件安装及资料准备
通过查阅网络资料等方法,初步了解现有数据分析师的常用技术平台,例如Python、R、Matlab、SPSS、Stata等;对基本的数据分析方法及基础统计学有一定了解;在上课前,以自己现有认知,思考总结一下 “什么是数据分析?” 。
第一章 关于Python你需要知道的事儿
1.1 为什么选择Python?
1.2 集成开发环境及Python运行
1.3 Jupyter Notebook 与 Spyder
第二章 变量及数值类型
2.1 数值类型概述
2.2 认识变量
2.3 算数运算
2.4 逻辑运算
2.5 注释#
第三章 序列及通用操作
3.1 可变序列/不可变序列概述
3.2 可变序列/不可变序列通用操作
3.3 列表list常用操作
3.4 文本序列str常用操作
第四章 字典映射
4.1 字典dict基本概念
4.2 字典的元素访问及遍历
4.3 字典常用操作
第五章 条件判断及循环语句
5.1 什么是语句?
5.2 条件判断:if语句
5.3 循环语句:for / while 循环
5.4 多重循环
第六章 函数
6.1 函数的基本概念及调用
6.2 自定义函数
6.3 局部变量及全局变量
6.4 匿名函数Lambda
第七章 模块与包
7.1 什么是模块?
7.2 模块创建及import指令运用
7.3 “包”的概念及python包管理工具:pip
7.4 windows环境下的代码运行
第八章 数据读写
8.1 文件对象声明及基本操作
8.2 系统模块下的路径操作
8.3 文件的读取与写入
8.4 pickle模块的运用
详细讲解Python数据分析工具包的使用,需要学员理解基本矩阵运算逻辑,需要预习一定的数据知识;熟练掌握第二门课程的所有知识,重点包括python下的数据加载、函数与模块。
第一章 科学计算工具:Numpy
1.1 什么是Numpy?
1.2 Numpy基础数据结构
1.3 Numpy通用函数
1.4 Numpy索引及切片
1.5 Numpy随机数
1.6 Numpy数据的输入输出
第二章 数据分析工具:Pandas
2.1 什么是Pandas?
2.2 Pandas数据结构:Series与Dataframe
2.3 Pandas基本技巧
2.4 Pandas数据加载及查看
2.5 Pandas数据提取及筛选
2.6 Pandas字段综合处理
2.7 Pandas排序
2.8 Pandas数据缺失值处理
2.9 Pandas常用运算函数
第三章 图表绘制工具:Matplotlib
3.1 什么是Matplotlib以及Python下的图表制作逻辑
3.2 Matplotlib图表制作通用函数
3.3 Matplotlib核心参数修改
3.4 Matplotlib子图逻辑
3.5 Matplotlib制作线型图
3.6 Matplotlib制作散点图
3.7 Matplotlib制作直方图
3.8 Matplotlib制作密度图
3.9 Matplotlib制作散点图
3.10 Matplotlib其他图表制作及细节
第四章 空间分析工具:GIS
4.1 为什么选择GIS工具做空间分析?
4.2 空间数据类型及加载方法
4.3 空间划分方法概述
4.4 空间距离计算
4.5 空间数据统计及叠加
4.6 空间数据与python交互
第五章 你必须知道的数据源
5.1 国外公开数据
5.2 国内公开数据
5.3 城市数据团-数据库介绍
实战项目
项目03 知乎数据清洗整理和结论研究
项目04 视频网站数据清洗整理和结论研究
数学统计思维是数据分析的核心,一个优秀的数据分析师是需要同时具备编程、统计学和批判思维能力。本课程将会从算法理论知识的讲解开始,帮助学员掌握核心统计算法技术,结合相关案例场景,打通思路,强化学员的数据研究能力,实现从 “数据分析” 到 “数据挖掘” 的进阶之路。
课程核心关键字:数据解析、特征分析、数理统计、模型构建。
第一章 数据特征分析
1.1 分布分析
1.2 对比分析
1.3 统计分析
1.4 帕累托分析
1.5 正太性检测
1.6 相关性分析
1.7 主成分分析
第二章 数据处理
2.1 缺失值处理
2.2 异常值处理
2.3 数据一致性检验
2.4 数据归一化
2.5 数据连续属性离散化
2.6 数据规约
第三章 数学建模
3.1 回归
3.2 分类
3.3 聚类
3.4 蒙塔卡罗模拟
实战项目
项目05 多场景下的算法构建
本门课程将会从数据结果输出角度来教授课程,分别结合Python、GIS、Gephi等多个技术平台实现数据可视化。课程会从可视化的图表表达逻辑及视觉美感入手,从理论到实践,帮助学员构建一套数据表达技术方法体系。
课程核心关键字:视觉表达、设计美学、多技术平台。
第一章 数据可视化整体概述
1.1 什么是数据可视化?
1.2 数据可视化技术体系及方向
1.3 数据图表表达的逻辑原理
1.4 设计美学
第二章 Python数据可视化(一):Seaborn
2.1 为什么选择Seaborn以及和Matplotlib的区别是?
2.2 整体风格设置
2.3 色彩参数调整
2.4 简单图表制作及可视化
2.5 复杂图表制作及可视化
2.6 关系网络数据可视化
2.7 热力图可视化制作
2.8 其他图标制作及细节参数
第三章 Python数据可视化(二):Bokeh
3.1 什么是Bokeh及其可视化交互原理?
3.2 环境搭建
3.3 数据读取及基本参数设置
3.4 简单图表制作及可视化
3.5 复杂图表制作及可视化
3.6 HTML调用及数据交互
第四章 关系网络数据可视化:Gephi
4.1 什么是关系网络图?
4.2 数据准备及整理
4.3 数据组织及关系整理
4.4 数据读取
4.5 核心参数设置
4.6 关系图表可视化表达
第五章 空间数据可视化
5.1 空间数据可视化工具概述
5.2 数据输出及整理
5.3 空间热力图表达
5.4 空间柱状图表达
5.5 空间线性轨迹图表达
5.6 其他空间图表可视化
实战项目
项目06 多场景下的图表可视化表达
本门课程将会结合之前所学的所有内容,针对10大场景进行数据挖掘项目实训。实训场景包括了经典课题及城市数据团的重点案例,学员需要以课程数据为起始,独立完成所有从数据清洗整理、特征分析、内容挖掘及数据可视化表达,并分别整合成一个数据分析成果报告。
课程核心关键字:魔鬼特训、综合实战、实战项目。
项目07 城市餐饮店铺选址分析
项目08 电商打折套路解析
项目09 中国姓氏排行研究
项目10 房价影响因素挖掘
项目11 国产烂片深度揭秘
项目12 中国城市资本流动问题探索
项目13 社会财富分配问题模拟
项目14 婚恋配对实验
项目15 泰坦尼克号获救问题
在当下这个数据为王的时代,无论是产品设计还是运营决策,都需要倚重于数据。本课程从实际案例出发,就如何对游戏产生的海量数据进行分析,并应用于改进游戏的设计和指导运营策略进行讲解。
讲师:宋威,网易盘古游戏部数据分析师
网易实战课将结合网易游戏、电商、教育、数据平台等一线产品真实案例,帮助学员进阶数据分析,包括网易游戏盘古工作室数据分析案例、网易考拉数据分析案例、网易严选数据分析案例、网易公开课/云课堂数据分析案例、网易有数平台数据分析案例。
讲师:周珍妮,网易严选资深数据分析师1、用户发展路径——从哪里来,到哪里去?
2、基于用户的目标构建体系与目标管理——分析三板斧中的“对比”延伸;
3、用户增长的“量”与“质”的平衡;
4、用户增长的曲线路径——当用户增长乏力时该如何追求流水增长?
指标体系的搭建是数据分析工作中最基础也是最重要的能力,高效搭建符合业务的指标体系将会使后续数据分析工作事半功倍,该案例结合讲师网易教育相关的工作经历,深入浅出的讲解业务指标体系的构建思路及方法。
讲师:吴彬彬,网易教育资深数据分析师
本课时会介绍网易有数这款企业级的敏捷分析平台,并通过几个真实的案例,介绍传统的汽车制造业如何利用网易有数快速从数据中发现业务问题,定位问题原因,找到解决问题的方法,从而获得业务增长。
讲师:王文开,网易资深数据产品经理
讲师:王志宇,Adobe数据科学家/斯坦福大学PHD1、消费者数据介绍
(a)介绍Longitudinal Data的概念以及其广泛的适用范围, 例如消费者行为预测,多只股票联合预测等。
(b)消费者有历史行为数据, 我们既可以用一个用户本身的历史行为来预测该用户未来的行为,也可以用其他类似用户的行为来预测该用户的行为
2、Longitudinal Data 的模型以及对消费者的应用
(a)介绍混合模型的概念。
(b)举实例说明如何利用混合模型来预测消费者行为。例如在电商中(亚马逊, Adobe, 沃尔玛等), 哪些消费者更有倾向购买本公司的产品,哪些客户可能在来年续订(取消)本公司的服务。
3、模型的评估以及衡量
(a)介绍ROC曲线的概念
(b)评估分组建模和整体建模的优劣
您的打赏,将用来升级服务器,感谢!
晓鹿
优酷职工
大鹏老师的讲课风格我个人比较喜欢,前期课程内容适合初学者,循序渐进,逐步深入。后期有大量实战项目和网易数据分析案例分享,这个是我买课程的主因,能将分析知识在不同场景中落地以及可以学到商业实践中数据分析的思路我认为是这个微专业最大的价值。