入门级
1.为什么要学习大数据?
2.怎么入门?
3.组件安装部署
3.1 原始安装
3.2 hdp或cdh安装
3.3 高手提升:服务器规划
4.进入各组件的服务
hdfs命令
hbase-shell
spark-shell
impala-shell
hive
zkCli.sh
5.tpc-ds基准测试
初级
1.启动任务
2.分析日志-查找问题
3.mapreduce是怎么运行的
4.通过api访问各个组件并做数据操作
4.1
hdfs文件系统操作
4.2 连接hive
4.3 连接hbase
4.4 连接spark
中级
1.序列化
2.压缩
3.HA
4.配置优化原理
5.DAG
6.map与reduce
6.1借助scala来学习map与reduce
高级
1.大数据组件适应场景
2.map或reduce任务对应的资源状态
2.1 申请、分配、释放、等待
3.规划框架图
4.常规使用培训
架构师
1.组件自身的设计原理
1.1 各开源的论文或原理
2.跟踪组件的bug
3.快速定位问题
4.规范日常操作
4.1 规避日常操作导致的问题
4.2 日常使用培训
5.跟踪新的技术发展方向
5.1 引进新的框架
评
5.2 估新技术的风险
入门,真的不难,你只要想懂sql语法,然后...花时间安装部署一下,再通过命令操作一下,知道日志存放在哪里?这个阶段,最要突然的是,通过日志分析,找出问题的能力。这个能力就是要不断的积累问题的原因,再记录下来。
另一个快速过初级的方法:就是去看别人发生的问题,变为自己的问题。每个组件其实也就那么些问题,你如果每个能收集50个问题的原因与解决方法,那恭喜你,已经到了中级的水平。
最难的其实是怎么度过 中级 的阶段,这个时间你才有机会来施展自己的想法,当然最后一步,架构师也是很难的,到这一步之后,基本上就没有办法停留的。
如果你不进步,就会跟不上,只有不断的学习学习学习......这就是大数据架构师们的痛苦。
相反,大数据方向的薪资还是比较高的,付出等于回报,希望大家不要放弃。
我自己也是做大数据开发的,可以分享我的工作经验,心得和学习的资源。
如果你想学习,或遇到问题。欢迎 私信我:学习
本文来自投稿,不代表本人立场,如若转载,请注明出处:http://www.sosokankan.com/article/1817955.html
赞 (2)
打赏 微信扫一扫
自动驾驶汽车将为人类带来更安全的环境
« 上一篇2019-12-26 22:11:47
“鲲鹏计算产业峰会·福建”在榕举行,鲲鹏生态创新中心正式启动
下一篇 »2019-12-26 22:15:29