Hadoop实战的读后感10篇
《Hadoop实战》是一本由Chuck Lam著作,人民邮电出版社出版的平装图书,本书定价:59.00元,页数:253,特精心从网络上整理的一些读者的读后感,希望对大家能有帮助。
《Hadoop实战》读后感(一):datajoin包有坑
☺☻☺☻☺☻☺☻☺☻☺☻☺☻☺☻☺☻☺☻☺☻☺☻够长了吗?
《Hadoop实战》读后感(二):Hadoop
《Hadoop实战》读后感(三):满分100:内容70+翻译20 = 90分
书中主要使用的是hadoop-0.19.1版本
翻译有些地方还是差强人意,上下文理解起来有时费劲
书中代码,不用说,在一个低版本上跑,包括自己搭环境,会是一个问题
个人不太推荐此书作为入门hadoop学习
整本书涉及的技术点可以说全部都是点到为止,不做深入,读完后,知道相关的技术点概念,实战性东西,靠自己摸索会效率很低
唯一觉得此书有价值的地方是:第8和10章内容,介于此,读电子版足矣!
貌似现在纸质的也还比较贵,所以真心不推荐
《Hadoop实战》读后感(四):跟大象跳舞的入门书籍
Hadoop的鼎鼎大名无人不知无人不晓,本书作为入门指导再合适不过,但阅读中文版本时总感觉不太通畅,有些专业术语转换成中文后就是有些别扭。
通过示例来学习Hadopp绝对是最好的方法,但关键是“In Action”,也就是实战,否则看再多的书也没有意义。只有在被复杂的SQL和海量数据大虐特虐后才会明白Hadoop的好,此话不假。
此书有一个亮点是介绍了如果构建基于AWS的Hadoop平台,可惜只简单提了一下EMS(Elastic Map Reduce),要是能有更详细的介绍就更完美了。
Hadoop的周边生态越来越眼花缭乱,时刻牢记能满足业务的就是最好的,不要贪多贪大,与君共勉。
《Hadoop实战》读后感(五):hadoop入门
1 基本上把mapReduce的思想讲清楚了,hadoop更多是使用方面的。基本上看个前三章,就能对mapreduce和hadoop有基本的理解。
2 它其实还没有严格来区分mapreduce和hadoop,根据我的理解。mapReduce是一种算法,一种思路。hadoop则实现了这种思路。为了应用这种思路,需要实现很多外围的功能,比如网络传输,任务分配等。这些内容hadoop都已经做好了,所以非常方面用它来实现自己的目的,只需要写自己的mapreduce的应用程序即可。
3 mapreduce的精髓个人认为是,把数据分布存储,然后用分布的机器各自计算这些存储数据,最后再合并统计。这样就实现了用多台廉价机取代单台昂贵机的目的。
4 hadoop目前不支持windows,只支持linux和unix,有条件的支持mac os。
《Hadoop实战》读后感(六):上手还行
这是一本不是傻瓜类型的上手书,个人一般称傻瓜型的为入门书。
好吧,第一部分就是傻瓜部分,只要你把前三章看完,你就知道hadoop是什么,hadoop总体结构,hadoop的基本运行原理。至少知道了什么是map reduce, 之前听一个搞数据库的哥们说了两回也没有太清楚。
第二部分没有细看,粗略翻了翻,看到了久违的Java很亲切,如果想上手搞搞的话,还是不错的行动指南。
第三部分也很价值,介绍了一些相关的东西,AWS,Pig,Hive这三个是详细介绍的,其它的还有很多提及了,如HBase 、ZooKeeper 、Mahout,案例部分最有价值,能够看到如何来实现一个Hadoop的过程,一般技术书里面提及的比较少。
所以,如果只要简单知道什么是Hadoop,推荐看看前三章。
《Hadoop实战》读后感(七):好好攒模板就行啦
本书和其他in action系列一样,不是官方文档事无巨细的解答,而是帮助你快速创建可用的代码,来解决实际中的问题。而对本书,前提是你要有还不错的Java功底。
就入门上手这个角度,这本书比hadoop权威指南好太多。也有可能是权威指南太厚了,让人抓不住重点,或者讲了很多有的没的的东西,讲编程模型这个关键部分就显得不出众。总而言之就是,实用性不强。
吐槽点:代码太老了,还不建议我们用新版api,醉了。
假如你是初学者,好好理解下面这句话,就够了。
大多数MapReduce程序的编写都可以简单地依赖于一个模板及其变种。当写一个新的MapReduce程序的时候,我们通常会采用现有的MapReduce程序,并将其修改为我们所希望的样子。(摘自本书4.2节)
所以你的学习路线可能是这样的:看一些经典问题的源码,比如排序,连接;复制到你能随手可用的地方;看到新的问题,看看是哪个类型的,就把对应的源码捞出来改改。
后记
这本书拖拖拉拉地看了四年,倒不是书写的不好,或者书太难。而是新手基本上看看前6章就行了。来不及看后面几章,后面就没怎么写MapReduce了,就转向了Hive/Pig,然后转向Spark/PySpark。唏嘘不已。
《Hadoop实战》读后感(八):Hadoop实战+超大集群调优_Hadoop集群调优课程
Hadoop实战+超大集群调优
课程使用到的软件:
apache-maven-3.0.5-bin.tar.gz
eclipse-jee-kepler-R-win32-x86_64
hadoop-1.1.2.tar.gz
hadoop-2.5.0-cdh5.2.0-src.tar.gz
hadoop-2.5.0-cdh5.2.0.tar.gz
hive-0.13.1-cdh5.2.0.tar.gz
jdk-7u67-linux-x64.tar.gz
jdk-7u79-linux-i586.gz
ieTTY 0.3.26.exe
rotobuf-2.5.0.tar.gz
ecureCRT.zip
VMWare10
CentOS
zookeeper-3.4.5-cdh5.2.0.tar.gz
第一阶段:hadoop入门学习
第00讲:课程概述
第1讲:hadoop1入门-HDFS架构
第2讲:hadoop1入门-HDFS副本存放策略
第3讲:hadoop1入门-mapreduce架构
第4讲:hadoop1入门-生产环境分布
第5讲:hadoop1伪分布搭建(1)
第6讲:hadoop1伪分布搭建(2)
第7讲:Mapreduce1运行过程详解
第三阶段:HDFS API开发和RPC框架介绍
第19讲:hadoop2伪分布搭建和maven工程搭建
第20讲:URL操作HDFS
第21讲: FileSystem操作HDFS(1)
第22讲:FileSystem操作HDFS(2)
第23讲:HDFS使用伪装用户
第24讲:获取HDFS集群信息
第25讲:HDFS案例演示
第26讲:RPC例子演示
第27讲:Namenode源码导读
第28讲:HDFS读写文件过程总结
第四阶段:Mapreduce开发
第29讲:MapReduce-键值对变化
第30讲:Mapreduce-WordCount例子演示
第31讲:MapReduce-Shuffle详解
第32讲:MapReduce-TOOL优化
第33讲:MapReduce-自定义计数器
第34讲:MapReduce-Map数和Reduce数设置
第35讲:MapReduce-最大值算法
第36讲:MapReduce-combine使用
第37讲:Mapreduce-TopN算法
第38讲:Mapreduce-自定义数据类型(手机流量)
第39讲:Mapreduce-自定义分区(1)
第40讲:Mapreduce-自定义分区(2)
第41讲:Mapreduce-二次排序
第五阶段:超大集群调优
第42讲:集群时间同步
第43讲:句柄数设置
第44讲:HDFS回收站配置
第45讲:配额管理
第46讲:Yarn资源配置
第47讲:日志管理
第48讲:本地库编译
第49讲:压缩格式介绍
第50讲:文件格式介绍
第51讲:YARN调度器配置
第52讲:Linux参数配置
第53讲:HDFS参数配置
第54讲:Mapreduce参数配置
第55讲:hadoop3新功能介绍
《Hadoop架构设计与源码分析第一季》
2016年最新Hadoop零基础实战视频教程