免费下载书籍地址:PDF下载地址
精美图片

Hadoop应用架构(影印版)书籍详细信息
- ISBN:9787564170011
- 作者:暂无作者
- 出版社:暂无出版社
- 出版时间:暂无出版时间
- 页数:暂无页数
- 价格:89元
- 纸张:暂无纸张
- 装帧:暂无装帧
- 开本:暂无开本
- 语言:未知
- 丛书:暂无丛书
- TAG:暂无
- 豆瓣评分:暂无豆瓣评分
内容简介:
暂无相关简介,正在全力查找中!
书籍目录:
暂无相关目录,正在全力查找中!
作者介绍:
暂无相关内容,正在全力查找中
出版社信息:
暂无出版社相关信息,正在全力查找中!
书籍摘录:
暂无相关书籍摘录,正在全力查找中!
在线阅读/听书/购买/PDF下载地址:
在线阅读地址:Hadoop应用架构(影印版)在线阅读
在线听书地址:Hadoop应用架构(影印版)在线收听
在线购买地址:Hadoop应用架构(影印版)在线购买
原文赏析:
如果关联的数据集恰好按照关联的键分桶,而且一个数据集中桶的数量是另一个的倍数,那么就足够单独关联相应的桶,而不需要关联整个数据集了。着显著降低了两个数据集执行 Reduce 端关联(Reduce-side join) 的时间复杂度。这是因为 Reduce 端的关联非常消耗资源。但是,如果关联的是两个桶数据集,而不是两个整数数据集,那么关联相应的桶即可。这样就可以减少关联消耗。当然,来自两个表的不同的桶可以并行关联。另外,分桶之后的数据量通常都比较小,一般能够放入内存。所以整个关联操作可以在 Map-Reduce 任务的 Map 阶段将小桶加载到内存中进行。这就是所谓的 Map 端关联(Map-side join)。与 Reduce 端关联相比,它的性能更好。如果使用 Hive 进行数据分析,应该能自动识别分桶的表并执行这种优化。
如果桶中的数据时有序的(sorted),那么就可以使用合并连接(merge join),而且关联时不会将整个桶都存入内存。这比简单的桶关联(bucket join)更快,而且更加节省内存。Hive 也支持这种优化。注意,任何一个表都可以分桶,在没有逻辑意义的分区点上也是如此。对于经常进行关联操作的大表,最好对数据进行排序和分桶,而且要按照关联字段分桶。
其它内容:
暂无其它内容!
书籍真实打分
故事情节:3分
人物塑造:8分
主题深度:7分
文字风格:3分
语言运用:5分
文笔流畅:6分
思想传递:6分
知识深度:6分
知识广度:8分
实用性:6分
章节划分:3分
结构布局:8分
新颖与独特:4分
情感共鸣:9分
引人入胜:6分
现实相关:9分
沉浸感:5分
事实准确性:4分
文化贡献:6分
网站评分
书籍多样性:3分
书籍信息完全性:5分
网站更新速度:4分
使用便利性:7分
书籍清晰度:5分
书籍格式兼容性:5分
是否包含广告:5分
加载速度:5分
安全性:4分
稳定性:4分
搜索功能:8分
下载便捷性:7分
下载点评
- 目录完整(102+)
- 情节曲折(376+)
- 收费(190+)
- 博大精深(634+)
- 格式多(273+)
- 速度快(176+)
- 值得购买(459+)
下载评价
网友 宫***玉:我说完了。
网友 瞿***香:非常好就是加载有点儿慢。
网友 融***华:下载速度还可以
网友 相***儿:你要的这里都能找到哦!!!
网友 冷***洁:不错,用着很方便
网友 訾***雰:下载速度很快,我选择的是epub格式
网友 扈***洁:还不错啊,挺好
网友 戈***玉:特别棒
网友 汪***豪:太棒了,我想要azw3的都有呀!!!
网友 屠***好:还行吧。
网友 苍***如:什么格式都有的呀。
网友 谭***然:如果不要钱就好了
网友 索***宸:书的质量很好。资源多
网友 邱***洋:不错,支持的格式很多
网友 堵***格:OK,还可以