免费下载书籍地址:PDF下载地址
精美图片

Hadoop应用架构(影印版)书籍详细信息
- ISBN:9787564170011
- 作者:暂无作者
- 出版社:暂无出版社
- 出版时间:暂无出版时间
- 页数:暂无页数
- 价格:89元
- 纸张:暂无纸张
- 装帧:暂无装帧
- 开本:暂无开本
- 语言:未知
- 丛书:暂无丛书
- TAG:暂无
- 豆瓣评分:暂无豆瓣评分
内容简介:
暂无相关简介,正在全力查找中!
书籍目录:
暂无相关目录,正在全力查找中!
作者介绍:
暂无相关内容,正在全力查找中
出版社信息:
暂无出版社相关信息,正在全力查找中!
书籍摘录:
暂无相关书籍摘录,正在全力查找中!
在线阅读/听书/购买/PDF下载地址:
在线阅读地址:Hadoop应用架构(影印版)在线阅读
在线听书地址:Hadoop应用架构(影印版)在线收听
在线购买地址:Hadoop应用架构(影印版)在线购买
原文赏析:
如果关联的数据集恰好按照关联的键分桶,而且一个数据集中桶的数量是另一个的倍数,那么就足够单独关联相应的桶,而不需要关联整个数据集了。着显著降低了两个数据集执行 Reduce 端关联(Reduce-side join) 的时间复杂度。这是因为 Reduce 端的关联非常消耗资源。但是,如果关联的是两个桶数据集,而不是两个整数数据集,那么关联相应的桶即可。这样就可以减少关联消耗。当然,来自两个表的不同的桶可以并行关联。另外,分桶之后的数据量通常都比较小,一般能够放入内存。所以整个关联操作可以在 Map-Reduce 任务的 Map 阶段将小桶加载到内存中进行。这就是所谓的 Map 端关联(Map-side join)。与 Reduce 端关联相比,它的性能更好。如果使用 Hive 进行数据分析,应该能自动识别分桶的表并执行这种优化。
如果桶中的数据时有序的(sorted),那么就可以使用合并连接(merge join),而且关联时不会将整个桶都存入内存。这比简单的桶关联(bucket join)更快,而且更加节省内存。Hive 也支持这种优化。注意,任何一个表都可以分桶,在没有逻辑意义的分区点上也是如此。对于经常进行关联操作的大表,最好对数据进行排序和分桶,而且要按照关联字段分桶。
其它内容:
暂无其它内容!
书籍真实打分
故事情节:4分
人物塑造:4分
主题深度:8分
文字风格:7分
语言运用:5分
文笔流畅:3分
思想传递:6分
知识深度:3分
知识广度:6分
实用性:4分
章节划分:9分
结构布局:8分
新颖与独特:9分
情感共鸣:6分
引人入胜:4分
现实相关:4分
沉浸感:6分
事实准确性:6分
文化贡献:6分
网站评分
书籍多样性:9分
书籍信息完全性:5分
网站更新速度:9分
使用便利性:4分
书籍清晰度:8分
书籍格式兼容性:8分
是否包含广告:8分
加载速度:6分
安全性:9分
稳定性:9分
搜索功能:9分
下载便捷性:3分
下载点评
- 下载速度快(636+)
- 四星好评(556+)
- 字体合适(547+)
- 愉快的找书体验(301+)
- 下载快(550+)
- 不亏(342+)
- 无盗版(618+)
- 速度慢(249+)
- 图文清晰(163+)
- 体验满分(508+)
- 值得购买(449+)
下载评价
网友 习***蓉:品相完美
网友 国***芳:五星好评
网友 孔***旋:很好。顶一个希望越来越好,一直支持。
网友 方***旋:真的很好,里面很多小说都能搜到,但就是收费的太多了
网友 孙***夏:中评,比上不足比下有余
网友 养***秋:我是新来的考古学家
网友 苍***如:什么格式都有的呀。
网友 权***波:收费就是好,还可以多种搜索,实在不行直接留言,24小时没发到你邮箱自动退款的!
网友 陈***秋:不错,图文清晰,无错版,可以入手。
网友 后***之:强烈推荐!无论下载速度还是书籍内容都没话说 真的很良心!
网友 扈***洁:还不错啊,挺好