大客户电力负荷管理系统技术规范(第二版) 下载本文

标题:大客户负荷管理系统技术规范 版本:2.0 01D2 01D3 01D4 广东电网公司 电流不平衡恢复 零序电流偏大恢复 超合同容量用电恢复 第一轮合闸 第二轮合闸 第三轮合闸 第四轮合闸 0152 0153 0154 0161 0162 0163 0168 0169 电流不平衡 零序电流偏大 超合同容量用电 非法呼叫 终端参数请求 表计注册(初次抄表成功时上报) 第一轮跳闸 第二轮跳闸 01E8 01E9 01EAH 01EBH 016AH 第三轮跳闸 016BH

第四轮跳闸 ? 数据内容

该字段存储终端告警时上传的参数信息

第 40 页

广东电网公司大客户负荷管理系统数据通信传输压缩算法设计与实现方案

附件二、数据通信传输压缩算法设计与实现方案

1 前言

电力负荷管理系统主站(前置机)与终端通过GPRS公众网或CDMA公众网进行数据传输时,其运行费用通过流量计费。如果在主站(前置机)与终端之间的传输数据采用压缩方式传送,可以有效地降低管理系统的运行费用,同时在一定程度上也起到对数据进行加密的作用。

鉴于以上原因,特制定本规范以统一广东电网公司大客户负荷管理系统数据压缩的设计与实现。

2 数据压缩算法设计

2.1 算法设计要求

? ? ?

算法必须适用于电能量数据实时压缩解压和数据完整性验证; 算法本身必须具有高效的数据压缩比、安全性和完整性; 压缩算法软件及接口必须有良好的可移植性。

2.2 无损数据压缩

数据压缩的目的是有效的利用存储设备的容量、信道带宽或通讯链路容量,以达到提高工作效率,降低系统工作成本的目的。

无损数据压缩技术可以归为两大类:统计方法和字典方法。统计方法是利用原数据中的字符出现频率的不均衡,对原数据进行重新编码;字典方法是,如果一段符号序列在前面出现过,则将当前字符序列用前面一段的位置指针替换掉,这些指针的集合构成字典。

第 41 页

广东电网公司大客户负荷管理系统数据通信传输压缩算法设计与实现方案

数据的压缩比定义为:

源代码长度-压缩后代码长度压缩比=?100%

源代码长度2.3 电能量数据特点

在大客户负荷管理系统中传输的数据信息主要是电能量相关数据,而这些数据最终归约为系统数据库中的记录。经研究分析电能量数据具有以下特点:

? 数据中零的个数较多。尤其比较长的数据中,为零的字节个数占到一半

以上;

? 数据格式相对固定,大多数数据有周期特点。很多数据的中间部分构成

一个矩阵,这个矩阵中有一些列相同,行与行之间相关度比较大;

? 数据长度比较小,但长度变化幅度较大,从几十个字节到2K的数据都

有。

2.4 本系统压缩算法----Ray-Period算法

根据前面所挖掘的电能量数据特点,算法设计中选择了多种无损压缩算法进行综合,称之为Ray-period算法。其中主要的算法是数据库压缩算法RAY,其它还包括周期字符压和位图压缩方法的特性,下面对这些算法分别进行介绍。

2.4.1

RAY压缩

RAY压缩是综合统计和字典方法,针对数据库的压缩算法,该方法有较高的压缩比。该方法的基本思想是:首先,对源数据流中的连字(就是相邻的两个字节)进行统频,将频率最高的连字用一个新的字符代替,那么这个字符和连字构成一个规则,重复上面的操作,直到连字频率小到某一个阈值。下面用一个例子来说明RAY的压缩流程。

对字符序列rubdubrubdub进行操作 连字频率 初始化语法 候选规则 语法结果 1->r2d2r2d2 2->ub ru:2,ub:4,bd:2,du:2,br:1 1->rubdubrubdub ub:4 第 42 页

广东电网公司大客户负荷管理系统数据通信传输压缩算法设计与实现方案

r2:2,2d:2,d2:2,2r:1 1->r2d2r2d2 2->ub r2:2,d2:2 1->3434 2->ub; 3->r2 4->d2 34:2,43:1 1->3434 2->ub 3->r2; 4->d2 34:2 1->55 2->ub 5->r2d2 55:1 1->55 2->ub 5->r2d2 1->55 2->ub 5->r2d2 表1 RAY压缩示例

根据语法规则,对源数据流进行替换后,再对语法规则进行Huffman或Shannon-Fano编码,附加在压缩数据流后面。

这里为了简单,直接将语法规则附加在压缩数据流后面,不进行编码。 2.4.2

位图压缩

基本思想是:对源数据流中经常出现的字符,用位图标记它的有效位置即可,举一个简单的例子。

源数据流:

压缩数据流:

这里常出现的字符就是B,解压缩时,对应位图标记中0的位置用B填充即可,那么数据由8个字节压缩到5个字节。根据数据特点,使用位图压缩主要对零字节进行压缩。

2.4.3

周期字符压缩

10110001 D1 D2 D3 D4 D1 B D2 D3 B B B D4 根据数据的周期性特点,对数据的相同列,以位图的形式只记录列的位置和代表元,例如以下数据:

第 43 页