MR 压缩和存储

网友投稿 272 2022-11-19

MR 压缩和存储

Hadoop 支持的压缩编码

压缩格式

算法

文件扩展名

是否可切分

LZO

LZO

.lzo

Snappy

Snappy

.snappy

DEFLATE

DEFLATE

.deflate

Gzip

DEFLATE

.gz

bzip2

bzip2

.bz2

Hadoop 编解码器

压缩格式

编解码器

LZO

com.hadoop.compression.lzo.lzopCodec

Snappy

org.apache.hadoop.io.compress.SnappyCodec

DEFLATE

org.apache.hadoop.io.compress.DefaultCodec

Gzip

org.apache.hadoop.io.compress.GzipCodec

bzip2

org.apache.hadoop.io.compress.BZip2Codec

压缩性能比较

压缩算法

原文件

压缩后

压缩比

压缩速度

解压速度

Gzip

8.3GB

1.8GB

21.68%

17.5MB/s

58MB/s

bzip2

8.3GB

1.1GB

13.25%

2.4MB/s

9.5MB/s

LZO

8.3GB

2.9GB

24.93%

49.3MB/s

74.6MB/s

Snappy

在64位模式下的Core i7处理器的单核上,Snappy以大约250 MB / sec或更高的速度压缩,并以大约500 MB / sec或更高的速度解压缩(​style="color: #24292E;">

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:springboot @PostConstruct无效的解决
下一篇:RapidIO:一种高性能、 低引脚数、 基于数据包交换的互连体系结构
相关文章

 发表评论

暂时没有评论,来抢沙发吧~