Введение
Дочерние акционерные общества энергетики и электрификации ОАО РАО «ЕЭС России» и другие электроснабжающие организации постоянно сталкиваются в своей повседневной работе с ситуациями, связанными с неучтенным потреблением электрической энергии. По минимальным оценкам финансовые потери только предприятий ОАО РАО «ЕЭС России» от неучтенного электропотребления ежегодно составляют около 10 млрд. рублей [1]. В связи с ростом тарифов увеличивается и мотивация неучтенного потребления электрической энергии. На сегодняшний день существует немало практических, аналитических методов и моделей, способов прогнозирования [3,4,9-11,14] параметров электропотребления. Однако поиск способов выявления хищений и занижения потребления электроэнергии по-прежнему остается актуальной задачей.
Далее предлагается рассмотреть возможности применения информационной технологии, относящейся к интеллектуальному анализу данных и представить полученные результаты к возможному использованию на практике.
Представим краткую характеристику системы интеллектуального анализа данных. С точки зрения задачи обработки большого массива данных об электропотреблении, "интеллектуальный анализ данных" (Data Mining) представляет собой комплекс программных средств обнаружения и обработки различными методами необходимых знаний из баз данных. Среди разнообразия имеющихся в распоряжении Data Mining средств обработки, была выбрана программа SPSS Statistics 17.0 [6,7,13,16-20]. О полученных результатах обработки данных электропотребления отметим следующее.
Материалы и методы
1. Одним из методов, принадлежащих интеллектуальному анализу данных можно отнести корреляционный анализ [5,12]. Его применение позволяет установить связь между параметрами, характеризующими зависимость электропотребления от многих факторов.
Корреляционный анализ – это метод обработки статистических данных, заключающийся в изучении коэффициентов корреляции между переменными. Другими словами, данный метод позволяет определить количественную взаимосвязь между несколькими параметрами исследуемой системы. Полученные значения коэффициентов корреляции подлежат сопоставлению с их табличными значениями, отраженными в табл. 1.
Таблица значений корреляции
Таблица 1
Коридор значений |
Интерпретация |
от 0 до 0,3 |
очень слабая |
от 0,3 до 0,5 |
слабая |
от 0,5 до 0,7 |
средняя |
0,7 до 0,9 |
высокая |
от 0,9 до 1 |
очень высокая |
2. Еще одним из методов анализа в данной работе был применен кластерный анализ [15]. С целью выявления роли каждого абонента в электропотреблении, выполнена процедура кластеризации, заключающаяся в разбиении множества абонентов на группы (или кластеры). Необходимость кластеризации обусловлена постановкой задачи выделения отдельных групп потребителей, относящихся, например, к группам, имеющим большую площадь домохозяйства и малое электропотребление.
Результаты и обсуждение
В качестве объекта анализа выбраны физические лица (более 300), являющиеся плательщиками за потребленную электроэнергию одного из населенных пунктов Республики Хакасия. Вся собранная информация была сведена в единую базу данных, предварительная обработка которых (на основе ежемесячных статистических данных) позволила сформировать среднемесячные показания по каждому абоненту и определить удельные значения электропотребления [2,8].
Для выполнения корреляционного анализа, предварительно получены графики электропотребления всеми домохозяйствами (данные об электропотреблении по месяцам в течение четырех лет с 2014 г. по 2017 г.) представленные на рис. 1, а также выделена информация о количестве комнат, количестве проживающих и площади домохозяйств каждого абонента.
Тренд электропотребления в течение нескольких лет сохраняет тенденцию сезонных колебаний. Поскольку потребление электрической энергии носит вероятностный характер, то проанализирован ряд факторов, которые, по мнению авторов статьи, влияют на электропотребление населением.
К таковым факторам отнесены площадь домохозяйств, количество проживающих и количество комнат.
Рисунок 1 – Потребление респондентами электрической энергии
Исходя из этого, в ходе работы над решением задачи выделены три подзадачи выявления корреляционной связи между: электропотреблением и площадью помещения абонента; электропотреблением и количеством лиц, проживающих в помещении абонента; между электропотреблением и количеством комнат в помещении абонента.
Результаты корреляционного анализа электропотребления:
- от площади помещения абонента – уровень корреляции не превышает 0,25;
- от количества лиц, проживающих в помещении абонента – уровень корреляции не превышает 0,117;
- от количества комнат в помещении абонента – уровень корреляции не превышает 0,06.
Из результатов следует, что зависимости между электропотреблением и количеством проживающих, количеством комнат и площадью очень слабые. Причем, корреляция между электропотреблением и площадью более существенная, чем между потреблением электроэнергии и количеством проживающих, а между электропотреблением и количеством комнат – самая несущественная.
Корреляционный анализ показал наличие слабой связи объемов электропотребления с рассматриваемыми показателями. Фактически существенным показателем остается сезонный фактор. Кроме этого в данных отсутствуют такие показатели как наличие электробойлеров, насосов подачи воды, механических станков различного назначения и др.
В процессе выполнения кластерного анализа получены следующие результаты. На рис. 2 представлены кластеры зависимости от удельного энергопотребления и площади домохозяйства по каждому абоненту.
Рисунок 2 – Графическое представление кластера от удельного энергопотребления от площади для каждого абонента
На данном изображении можно заметить, что есть определенный диапазон, в котором сосредоточено большинство домохозяйств, однако имеются потребители, которые при наличии больших площадей имеют незначительное потребление электроэнергии.
Для более точной кластеризации применена процедура выявления групп абонентов на основе трех показателей: среднемесячное электропотребление на человека, на комнату и на один квадратный метр площади. Результаты представлены на рис. 3.
Рисунок 3 – Трехмерное представление кластера от удельного электропотребления на человека, на комнату и на квадратный метр площади
Выводы
Полученные результаты свидетельствуют об очень низкой взаимосвязи между электропотреблением и выделенными факторами, как площадь домохозяйства, количество проживающих и количество комнат. Это означает, а именно: на электропотребление могут влиять благосостояние потребителя, метеорологические условия, сезонные факторы, оснащенность домохозяйства бытовой техникой и др.
Подтверждена значимость применения интеллектуального анализа данных в задаче влияния различных факторов (применительно к домохозяйствам сельской местности) на объемы электропотребления и выявления неблагонадежных абонентов.
архив: 2013 2012 2011 1999-2011 новости ИТ гость портала 2013 тема недели 2013 поздравления