﻿ 基于云模型的水闸泵站远程监测数据挖掘分析
 上海理工大学学报  2020, Vol. 42 Issue (3): 298-304 PDF

1. 上海市青浦区河道水闸管理所，上海 201799;
2. 上海理工大学 光电信息与计算机工程学院，上海 200093

Data mining analysis of remote monitoring of sluice pumping station based on cloud model
LI Xiaochun1, ZHANG Sheng2
1. Shanghai Qingpu District River Sluice Management Institute, Shanghai 201799, China;
2. School of Optical-Electrical and Computer Engineering, University of Shanghai for Science and Technology, Shanghai 200093, China
Abstract: In order to improve the forecasting and warning ability of sluice pumping station monitoring, considering the multi-factor affecting the safety of sluice pumping station and the huge amount of monitoring data, a method for mining association rules of sluice pumping station monitoring data was proposed, which combines the cloud model with the improved Apriori algorithm. Firstly, the attribute space of monitoring data was established, and the soft partition of attribute space was realized by using the reverse cloud model, and the monitoring data were discretized. In order to avoid the disadvantage of long time taken for multi-scanning database with the traditional Apriori algorithm, the binary was used to storage data and frequent itemsets were got through ‘and operation’. Considering the dynamic increase of data, an incremental update method was proposed to update rules. Finally, the monitoring data analysis of a sluice pumping station in a city was taken as an example to verify the effectiveness of the proposed method.
Key words: safety warning     cloud model     data mining     binary storage     Apriori algorithm

1 云理论相关知识 1.1 云模型及相关概念

En：即不确定性的度量，反映在论域中能够被该定性概念所接受的范围。熵越大，定性概念越模糊，随机性也越大。

1.2 云发生器

 图 1 逆向云发生器示意图 Fig. 1 Schematic diagram of a backward cloud generator

 图 2 X条件发生器示意图 Fig. 2 Schematic diagram of a X condition generator

2 基于云模型的属性空间软划分

2.1 监测数据属性空间软划分

 ${\text{属性}}\left\{ \begin{array}{l} {\text{好}},\;E{x_1} = E{x_2} - vE{n_2}\\ {\text{中}},\;E{x_2} = Ex,E{n_2} = En,H{e_2} = He\\ {\text{差}},\;E{x_3} = E{x_2} + vE{n_2} \end{array} \right.$ (1)

2.2 隶属度计算及语言值转换

3 考虑增量更新的关联规则挖掘方法

3.1 基于加权二进制的Apriori算法

 $w = \frac{{{\mathop{ count}\nolimits} \left( {{t_{{{i}}}}} \right)}}{{{\mathop{ count}\nolimits} (Tid)}}$ (2)

3.2 加权二进制Apriori算法的增量更新过程

Apriori算法虽然能够帮助解决规则提取的问题，但是，随着数据的不断增长，水闸泵站中的数据不断更新。采用Apriori算法挖掘更新后的数据耗时多、效率低，因此，本文采用Apriori算法的增量更新方式来获取频繁项集，无需对所有数据进行更新，可以降低时间成本，具体的方法描述如下。

a. 对于原始数据集形成频繁项集为LP），新增数据集的频繁项集为Lp），依据某项集dPp中为频繁项集，在（P+p）中也为频繁项集，找出在Pp中相同的频繁项集，放入（P+p）的频繁项集LP+p）中。

b. 当项集dLp）且d $\notin$ LP）时，扫描数据集P得到支持度supportP，再在p中求出supportp，以及求出d在（P+p）中的supportP+p，如式（3）所示，若supportP+pminsup，则将d作为频繁项集LP+p）中的一部分，反之不是频繁项集。

 ${{ support}}{{\rm{ }}_{P + p}} = \frac{{sup por{t_P}|P| + sup por{t_p}|p|}}{{|P| + |p|}}$ (3)

c. 当项集dLP）且d $\notin$ Lp）时，扫描数据集p得到支持度supportP，再在P中求出supportp以及求出d在（P+p）中的supportP+p，如式（4）所示，若supportP+pminsup，则将d作为频繁项集LP+p）中的一部分，反之不是频繁项集。

 ${{ support}}{{\rm{ }}_{P + p}} = \frac{{sup por{t_P}|P| + sup por{t_p}|p|}}{{|P| + |p|}}$ (4)

d. 若项集dP中为非频繁项集，在p中也为非频繁项集，那项目集在（P+p）中也为非频繁项集。

4 案例分析

5 结束语

a. 基于云模型的属性空间软划分方法处理水闸泵站监测数据，将数值数据转化为数据挖掘算法可用的定性概念语言值。

b. 利用二进制存储监测数据值，并通过“与运算”获取频繁项集。考虑到数据是不断更新的，采用基于增量更新的Apriori算法挖掘水闸泵站指标的规则，分析规则后的隐含意义，从而为水闸泵站可能的隐患给出预测和预警。

 [1] 张大庆. 区域水闸泵站远程监测系统[J]. 仪器仪表与分析监测, 2013(2): 16-18. DOI:10.3969/j.issn.1002-3720.2013.02.006 [2] 李昌志, 郭良, 刘昌军, 等. 基于分布式水文模型的山洪预警临界雨量分析——以涔水南支小流域为例[J]. 中国防汛抗旱, 2015, 25(1): 70-76. DOI:10.3969/j.issn.1673-9264.2015.01.024 [3] 臧英平, 沃玉报, 徐影. 基于故障树法的水闸工程安全预警体系研究[J]. 水资源与水工程学报, 2015, 26(4): 163-168. DOI:10.11705/j.issn.1672-643X.2015.04.031 [4] 付传雄, 张君禄, 廖文来, 等. 近海软基水闸水平位移监控指标研究[J]. 水利与建筑工程学报, 2017, 15(6): 173-176. DOI:10.3969/j.issn.1672-1144.2017.06.034 [5] 方卫华. 水闸安全监测及可靠性评价研究[J]. 贵州水力发电, 2006, 20(2): 61-65. DOI:10.3969/j.issn.1007-0133.2006.02.019 [6] 陈碧云, 丁晋, 陈绍南. 基于关联规则挖掘的电力生产安全事故事件关键诱因筛选[J]. 电力自动化设备, 2018, 38(4): 68-74. [7] 刘云翔, 韩贝. 基于改进FP算法的隧道交通事故关联分析[J]. 现代电子技术, 2018, 41(17): 141-144. [8] 周辉宇. 基于大数据规则挖掘的交通拥堵治理研究[J]. 统计与信息论坛, 2017, 32(5): 96-101. DOI:10.3969/j.issn.1007-3116.2017.05.015 [9] 王有元, 周立玮, 梁玄鸿, 等. 基于关联规则分析的电力变压器故障马尔科夫预测模型[J]. 高电压技术, 2018, 44(4): 1051-1058. [10] 孟凡荣, 郑中珮, 陈佩佩. 一种基于云理论的空间关联规则提取算法[J]. 微计算机信息, 2008, 24(27): 135-137. DOI:10.3969/j.issn.1008-0570.2008.27.054 [11] 李德毅, 孟海军, 史雪梅. 隶属云和隶属云发生器[J]. 计算机研究与发展, 1995, 32(6): 15-20. [12] 孟凡荣, 宋春景, 郑中珮, 等. 基于云理论的煤矿安全监测数据关联规则挖掘[J]. 小型微型计算机系统, 2008, 29(9): 1622-1626.