第一部分:
数据基础设施:数据收集、存储与计算系统
1.数据收集: 使用分布式收集工具Sqoop/Flume对数据进行统一收集
介绍如何使用Sqoop和Flume将各种异构数据源(包括关系型数据库、web服务器日志等)中的数据收集到Hadoop中。
2.数据存储:使用分布式存储系统HDFS/HBase对数据进行集中式存储
介绍如何使用HDFS和HBase对大数据进行存储和管理。
3.数据分析与计算:包括批处理、交互式和内存计算三种
(1)如何针对不同场景选择不同分析与计算系统;
(2)ETL与批处理计算:MapReduce与Hive;
(3)实时查询与OLAP :MySQL/Impala/Shark;
(4)基于内存的迭代式机器学习: Spark。
第二部分:
数据挖掘与机器学习算法
1.分类、聚类算法(贝叶斯、逻辑回归、决策树、随机森林、SVM、k-means、
LDA、PCA、神经网络等基本算法);
2.深度学习(Deep Learning)科普;
3.如何进行模型选择和调优;
4.使用Numpy/Scipy/Scikit-learn进行简单的、单机机器学习工作;
5.使用Spark进行分布式机器学习工作。
第三部分:数据团队建设与构成
1.数据基础设施RD
2.数据挖掘与机器学习RD
3.数据科学家
4.商业分析师
5.战略分析师
第四部分:用户标签系统建设
1.用户属性与行为建模
2.用户属性挖掘与预测
3.用户行为挖掘与预测
第五部分:用户的数据化运营实例
1.分层营销与用户价值
2.用户生命周期与流失预警、召回
3.用户的交叉购买
4.用户的兴趣与偏好
5.用户交易的风险防控
6.除了发优惠券,我们还能做什么
7.A/B测试
8.大数据带来的商业价值的投入产出比
董西成
ChinaHadoop小象社区核心成员
讲师介绍:《Hadoop技术内幕:深入解析MapReduce架构设计与实现原理》和《Hadoop技术内幕:深入解析YARN架构设计与实现原理》书籍作者;资深Hadoop技术实践者和研究者,曾参与商用Hadoop原型研发,以及分布式日志系统、全网图片搜索引擎、Hadoop调度器等项目的设计与研发。
梁堰波
ChinaHadoop小象社区核心成员
讲师介绍:美团网,数据开发与数据挖掘;北京航空航天大学,计算机硕士;法国电信研发中心,云计算与大数据研究员;百度基础架构部存储组,软件开发实习生;VMware中国研发中心Big Data & Cloud组,研发实习生。
本次培训为精品小班,限50人。 |
一、下载《大数据专场培训报名表》 二、填写个人信息以及发票信息 三、付款方式 (1)银行转账: 开户银行 北京银行(中关村海淀园支行) 银行帐号 0109 1448 7001 2010 5047543 收款人 北京无忧创想信息技术有限公司 (2)支付宝转账: 支付宝账号:pay@51cto.com 四、购票成功 向您发送电子门票及邮寄发票。 |