全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...

基于多头注意力与双向门控循环单元的数据无损压缩方法
Lossless Data Compression Method Based on Multi-Head Attention and Bidirectional Gated Recurrent Unit

DOI: 10.12677/CSA.2024.142051, PP. 517-526

Keywords: 数据无损压缩,双向门控循环单元,Transformer
Lossless Data Compression
, Bidirectional Gated Recurrent Unit, Transformer

Full-Text   Cite this paper   Add to My Lib

Abstract:

为解决数据归档存储场景中出现的物理存储成本增长和数据库内存紧张等问题,本文提出一种基于注意力机制与双向门控循环单元的数据无损压缩方法,采用Transformer和双向门控循环单元作为概率预测器,输出数据流的条件概率分布,结合自适应算术编码器对数据进行压缩。实验对比结果表明,本文所提方法相较于算术编码和基于字典模型的LZW这两种传统无损压缩方法,压缩率分别平均提升约28.8%和7.8%;相较于Cmix v19和NNCP两种深度学习方法,平均压缩率分别降低0.4%和0.2%,但平均压缩时间分别约为其5.1%和39.4%。
To solve the problems of rising physical storage cost and memory of database limitation in the archiving and storing scenario of data, a lossless data compression method based on multi-head attention and bidirectional gated recurrent unit is proposed in this paper. Transformer and bidirectional gated cycle unit are used as probability predictors to output conditional probability distribution of data flow and an adaptive arithmetic encoder is combined to compress the data. The exper-imental results show that compared with the two traditional lossless compression methods, arithmetic coding and LZW based on the dictionary model, the compression ratio of the proposed method is improved by 28.8% and 7.8% respectively. Compared with Cmix v19 and NNCP, the average compression rate is reduced by 0.4% and 0.2%, respectively, but the average compression time is about 5.1% and 39.4%, respectively.

References

[1]  嵇月强. 工业历史数据库的研究[D]: [硕士学位论文]. 杭州: 浙江大学, 2007.
[2]  刘媛媛, 何文春, 王妍, 李江涛, 白金婷. 气象大数据云平台归档系统设计及实现[J]. 气象科技, 2021, 49(5): 697-706.
[3]  赵力帅, 李耕宇, 武振宇, 刘鹏. 基于分层异构数据库系统的历史数据归档技术[J]. 电信科学, 2018, 34(S1): 174-178.
[4]  王平. LZW无损压缩算法的实现与研究[J]. 计算机工程, 2002(7): 98-99+150.
[5]  徐慧. 实时数据库中数据压缩算法的研究[D]: [硕士学位论文]. 杭州: 浙江大学, 2006.
[6]  于恒, 梅红岩, 许晓明, 等. 基于深度学习的图像压缩算法研究综述[J]. 计算机工程与应用, 2020, 56(15): 15-23.
[7]  励益韬, 孙未未. 基于循环神经网络的轨迹压缩算法[J]. 计算机科学, 2020, 47(10): 102-107.
[8]  刘文顺. 基于字节对编码的无损压缩算法[D]: [硕士学位论文]. 杭州: 浙江大学, 2023.
[9]  苏月明. 基于深度学习的压缩成像算法研究[D]: [博士学位论文]. 秦皇岛: 燕山大学, 2022.
[10]  闫赛然. 基于深度学习的压缩感知磁共振重建[D]: [硕士学位论文]. 北京: 北京交通大学, 2022.
[11]  任欢, 王旭光. 注意力机制综述[J]. 计算机应用, 2021, 41(S1): 1-6.
[12]  尹航, 范文婷. 基于Transformer目标检测研究综述[J]. 现代信息科技, 2021, 5(7): 14-17.
[13]  牛哲文, 余泽远, 李波, 唐文虎. 基于深度门控循环单元神经网络的短期风功率预测模型[J]. 电力自动化设备, 2018, 38(5): 36-42.
[14]  桑海峰, 陈紫珍. 基于双向门控循环单元的3D人体运动预测[J]. 电子与信息学报, 2019, 41(9): 2256-2263.
[15]  李雷定, 马铁华, 尤文斌. 常用数据无损压缩算法分析[J]. 电子设计工程, 2009, 17(1): 49-50+53.
[16]  Bellard, F. (2019) Lossless Data Compression with Neural Networks.
https://bellard.org/nncp/nncp.pdf
[17]  Knoll, B. (2014) CMIX.
https://www.byronknoll.com/cmix.html
[18]  吴晓云. 算术编码算法在图像压缩中的研究[J]. 计算机与数字工程, 2017, 45(9): 1863-1865.
[19]  刘尧, 蒋林, 李远成, 山蕊. 自适应二进制算术编码的动态可重构实现研究[J]. 电子测量技术, 2022, 45(19): 50-55.

Full-Text

comments powered by Disqus

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133

WeChat 1538708413