hive表类型压缩方式对比

网友投稿 263 2022-11-16

hive表类型压缩方式对比

几种压缩方式笔记:

textfile 存储空间消耗比较大,并且压缩的 text 无法分割和合并 查询的效率最低,可以直接存储,加载数据的速度最高 sequencefile 存储空间消耗大,压缩的文件可以分割和合并 查询效率高,需要通过text 文件转化来加载 rcfile 存储空间最小,查询的效率最高 ,需要通过 text 文件转化来加载, 加载的速度最低相比 TEXTFILE 和 SEQUENCEFILE,RCFILE 由于列式存储方式,数据加载时性能消 耗较大,但是具有较好的压缩比和查询响应。数据仓库的特点是一次写入、多次读取,因此, 整体来看,RCFILE 相比其余两种格式具有较明显的优势。 通过比较: 使用压缩可以提高hdfs的存储能力,还有加快我们查询效率。 在工作中常用压缩方式rc和orc

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:C语言头文件组织作用与包含原则详解
下一篇:Java类的加载时机与过程
相关文章

 发表评论

暂时没有评论,来抢沙发吧~