哈夫曼编码在文件压缩中的应用 - 图文 下载本文

南京邮电大学2009届本科生毕业设计(论文)

2.5 本章小结

在这一章中,重点向大家介绍了现有的针对哈夫曼编码的介绍。从静态哈夫曼编码到动态哈夫曼编码,然后对这两种方法进行了比较,列举出了两者的异同,通过比较对两种方法了解更透彻。然后继续介绍了对哈夫曼编码的改进,在原有编码技术的基础上引入堆排序等,系统性的对现有的技术进行了一个比较全面的介绍。

21

南京邮电大学2009届本科生毕业设计(论文)

第三章 哈夫曼编码压缩软件的设计模型

上一章节中,我们对现有关于哈夫曼编码技术的有了一个更深一步的了解和认识,但是关于怎么利用算法对文本和图片进行压缩?程序设计的思路是什么?需要哪些模块?对于这一系列的问题,将在本章中为大家解答,介绍程序设计的思想、流程等。

3.1设计思想

要完成哈夫曼的编码和解码需要首先建立哈夫曼树,之后对所有字符根据权重进行编码,最后再对文件内容进行编码和解码。

首先定义适合哈夫曼树的节点类型,需要定义的有当前节点的字符,当前节点的左子、右子和父亲指针。在建立哈夫曼树之前还需要对出现的字符和权重进行统计和记录,并且定义一个可以筛选出最小权重的函数。

初始化树节点之后开始建立哈夫曼树。先在所有可能出现的字符中筛选出当前权重最小的两个字符,将这两个字符分别作为新节点的左子和右子建立一个小的二叉树,并将两个字符的权重之和赋值给新节点,将新二叉树放入筛选字符中,再将筛选过的两个字符从筛选列表中淘汰掉。依次对列表中剩下的字符进行权重最小的筛选,直到根节点(如果编码表共有N个字符,则2*N-1就为最终根节点)为止,也就是当筛选列表为空的时候,哈夫曼树即建立完成。

对于哈夫曼编码树来说,由于哈夫曼编码是前缀码,所以所有要编码的字符最终都将是这颗树的叶子节点,而其它节点并没有真正的字符意义。即当哈夫曼编码树建立之后,对树的所有叶子节点进行打印可知道是否有字符遗漏或多余。

建立编码表时要根据每个出现的字符的权重对建立的哈夫曼树的每个叶子节点进行编码。编码时要从叶子节点出发向根节点进行逆向编码。判断如果当前节点为左子则对其编码‘0’,如果当前节点为右子则对其编码‘1’。以此类推进行编码直到根节点为止。此时的编码是逆向的,所以需要将码值逆向存储。依次对每一个叶子节点进行编码操作,即可得到当前哈夫曼树的编码表。

对于码值的逆向存储可以使用栈结构,先将一个码的每一步编码存入栈,再在一个码结束后出栈至空。当然也可以定义一个字符型数组,将值从后向前存入数组,再将数组有值部分粘贴到新的数组中进行存储。本次采用了后者,因为个人认为为此一步操作建立栈结构不划算,而且前一个设计也已经熟练掌握了栈的方法,此处进行新的尝试会更好。

首先需要建立一个原始文件,在文件中输入需要编码的内容。之后将文件打开,将其中的内容存储到字符串中以便程序编码调用。开始对需要编码的字符进行编码,将字符逐一读取与刚刚建立的编码表中的每个叶子节点代表的字符进行

22

南京邮电大学2009届本科生毕业设计(论文)

比较,找出相同的对象,并将当前节点的编码打印到屏幕,并将编码存入到新建的密码文件当中。

先打开密码文件,将之前编码后得到的密文内容存储到字符串中以便解码调用。开始对密文的字符串进行解码,树索引从根节点开始走,当密文中的当前字符是‘0’的时候,则索引走向左子节点;当是‘1’的时候,则走向右子节点。以此类推,一直走到叶子节点为止,则当前叶子节点所代表的字符即为前一段密文的解码结果,。再对下一个字符依次从根节点开始解码,如此循环对每一段密文进行解码直到解码结束。将解码打印到屏幕,并将解码结果存入到新的解码文件当中。

3.2算法流程图

第一步:建立哈夫曼树

图1建立哈夫曼树的算法流程图

23

南京邮电大学2009届本科生毕业设计(论文)

第二步:构建哈夫曼编码表

图2构建哈夫曼编码表的算法流程图

24