当前位置:首页 > CDA数据分析师
CDA数据分析师
第一阶段:Excel数据分析
1.Excel数据处理技巧和高效方法 2.Excel数据收集、整合、规范化 3.Excel公式、函数、数组及数据分析
4.Excel可视化数据分析(排序、筛选、透视表等) 5.Excel图表化数据呈现 6.商业智能分析(Power BI)
第二阶段:数据分析理论基础
1.集中趋势、离散测度、均值、中位数、众数、方差、点估计、区间估计等相关的知识 2.假设检验 T检验、方差、相关性、列联分析 3.回归分析 4.主成分分析 5.时间序列
第三阶段:数据库管理
1.MySQL数据库基本操作;
2.MySQL数据类型和运算符、数据的CRUD操作; 3.MySQL用户管理; 4.MySQL数据备份与还原; 5.MySQL函数;
6.中型、大型数据清洗查询案例;
第四阶段:SPSS数据分析
(1)数据处理流程、数据的输入输出 (2)描述统计分析,常用的统计图形 (3)T检验、方差分析、与数据库连接 (4)相关、偏相关分析,线性回归 (5)Logistic、分类变量回归、ROC曲线 (6)缺失值的处理、主成分分析
(7)因子分析、K-means聚类,层次聚类 (8)神经网络、RFM模型、对应分析、联合分析 (9)时间序列、总结
第五阶段:数据挖掘算法
1.关联规则; 2.决策树; 3.贝叶斯; 4.SVM; 5.神经网络。
第六阶段:R语言
1.R基础编程
2.R中高级图表(Echart)与信息压缩 3.数据清洗 4.统计推断
5.客户价值预测_线性回归模型诊断 6.逻辑回归与决策树
7.KNN、朴素贝叶斯、svm、聚类与客户画像 8.汽车金融信用违约预测模型案例
第七阶段:案例分析实战
1.互联网广告中的大数据应用;
2.利用时间序列精准预估零售业的销量及营业额; 3.如何在保险行业中使用决策树并展示其成果;
4.如何在零售行业中应用Logistic回归和线性回归估计客户生命价值。
选修方向一:Python数据分析(13期上海)
1.Python编程基础; 2.Numpy数组和矢量计算; 3.Pandas基础&进阶; 4.Python爬虫初级; 5.python推荐系统实践;
6.案例分析。
选修方向二:SAS数据挖掘(12期深圳)
1.SAS Base基础编程; 2.SAS Base高级编程; 3.SAS统计分析; 4.SAS电商数据挖据; 5.SAS信用评级模型;
案例:如何利用客户分群实现保险行业中潜在客户的精准定位 案例:如何针对行业特性进行营销组合优化.
『视频』大数据分析周末班第10期
CDA2级大数据前沿知识介绍,免费观看
大数据基础知识 点击观看
第一阶段:大数据前沿知识及hadoop入门
1.大数据前沿知识介绍 2.课程介绍
3. Linux及unbuntu系统基础
4.hadoop的单机和伪分布模式的安装配置
第二阶段:Hadoop部署进阶
1.Hadoop集群模式搭建
2. Hadoop分布式文件系统HDFS深入剖析 3.使用hdfs提供的api进行hdfs文件操作 4. Mapreduce概念及思想
第三阶段:大数据导入与存储
1.mysql数据库基础知识 2.hive安装部署与案例 3.sqoop安装及使用
第四阶段:Hbase理论及实战
1. hbase简介 2.安装及配置
第五阶段:Spark配置及使用场景
1. spark简介、安装及配置 2.scala简介、安装及语法讲解
第六阶段:spark大数据分析原理
1.Spark内核:基本定义、Spark任务调度 2.Spark Streaming 实时流计算 3.Spark MLlib 机器学习 4.Spark SQL 实战
第七阶段:hadoop+Spark大数据分析
1.实战案例深入解析
2.hadoop+Spark的大数据分析之分类 3.Logistic回归与主题推荐
与南京大学、东南大学合作,颁发“CDA数据分析师”“高级、中级、初级”证书
丁亚军
南京上度咨询数据分析总监、经管之家论坛SAS、SPSS版版主,CDA数据分析研究院研究员和SAS、SPSS软件讲师。 研究方向为“统计软件与数据分析”、“市场调查分析”、“数据挖掘咨询”。
王小川
神经网络、数据挖掘、统计分析应用领域专家,国内最大的MATLAB论坛管理员,在硕士与博士期间,参与发表了SCI论文6篇,核心期刊论文5篇,获得同济大学奖学金,精通各类统计学软件,参与编写《MATLAB神经网络30案例分析》等书籍。
翟祥
共分享92篇相关文档