传统的防窃漏电方法主要通过定期巡检、定期校验电表、用户举报窃电等方法来发现窃电或计量装置故障。但这种方法对人的依赖性太强,抓窃查漏的目标不明确。 

目前,很多供电局主要通过工作人员利用计量异常报警功能和电能量数据查询功能开展用户用电情况的在线监控工作,通过采集电量异常、负荷异常、终端报警、主站报警、线损异常等信息监测窃漏电情况和发现计量装置的故障。根据报警事件发生前后客户计量点有关的电流、电压、负荷数据情况等,构建基于指标加权的用电异常分析模型,实现检查客户是否存在窃电、违章用电.及计量装置故障等。 

以上防窃漏电的诊断方法,虽然能获得用电异常的某些信息,但由于终端误报或漏报过多,无法达到真正快速精确定位窃漏电嫌疑用户的目的,往往令稽查工作人员无所适从。 而且在采用这种方法建模时,模型输入指标权重的确定需要用专家的知识和经验来判断,具有很大的主观性,存在明显的缺陷,所以实施效果往往不尽如人意。 

现有的电力计量自动化系统能够采集到各相电流、电压、功率因数等用电负荷数据以及用电异常等终端报警信息。 异常告警信息和用电负荷数据能够反映用户的用电情况,同时稽查工作人员也会通过在线稽查系统和现场稽查来找出窃漏电用户,并录入系统。 通过这些数据信息提取出窃漏电用户的关键特征,构建窃漏电用户的识别模型,就能自动检查、判断用户是否存在窃漏电行为,大大降低稽查工作人员的工作量,保障人民的正常用电,安全用电。

载入数据并进行数据探索

选择好数据集之后,里面是一个用户的三个窃漏电指标以及用户是否真实窃漏电的数据。其中包括:电量趋势下降指标,线损指标,告警类指标数量 以及 是否窃漏电。 

这里我们可以通过从左侧 组件-统计分析 拖入相关系数矩阵这个组件,来观察各个特征对于输出电力。 

右键单击完成的组件,选择查看分析报告,就可以得到我们的相关性分析了。从这张相关性图中,我们会发现,其实这三个指标对于最终是否为窃电用户的关系都不是特别明显,也就是说决定用户是否为窃电用户的特征并不明显的具有单一性。此时我们还可以通过左侧的 组件-统计分析 拖入数据视图 来分析各个特征对于我们的标签列的数据分布。我们只需要按照如下配置选择特征列: 

然后选择我们的标签列. 

最后我们同样右键单击从此处开始运行后,右键单击完成的组件,选择查看分析报告,就可以看到各个特征和标签列在数据分布上的关系。

对数据进行建模

完成简单的探索性分析之后,我们就可以开始选择合适的算法模型建模了。我们可以先通过 组件-数据预处理 中的拆分组件 对数据做一次拆分,将数据分为训练集和测试集。

然后我们可以使用组件-机器学习-回归 中的逻辑回归二分类 来对我们的数据进行回归建模。这里我们需要选择我们的特征列(X)和我们的标签列(Y) 这里我们的特征列就选择 : power_usage_decline_level ,line_loss_rate 和 warning_num 

对回归模型进行预测和评估 

建模完毕之后,我们可以通过 组件-机器学习 中的预测来预测该模型在测试数据集上的效果。特征和原样输出我们都可以默认全选。然后我们再从左侧的 组件-机器学习-评估 中选择二分类评估 即可获得我们的模型效果 这时候整个实验的应该如下图: 

右键我们完成运行的二分类评估组件,即可看到我们的模型效果。这里我们的AUC达到了 0.9827, 效果非常不错。 

这样我们就通过机器学习PAI平台完成了用户窃电行为的识别。我们可以通过EAS在线部署将这个服务部署为可在线调用的服务,为电网提供用户窃电行为的在线识别服务.

本实验参考了《Python数据分析与挖掘实战》,如有版权等问题,请联系本文作者。我们尊重学术领域每一位研究者们对于学术的贡献,致力将技术和现实生活更好的结合应用落地。

声明:本文来自天池大数据科研平台,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。