INNOV.RU | Информационный портал 

Иннов: электронный научный журнал
 

Интеллектуальный анализ данных электропотребления домохозяйствами сельской местности

Data mining of households’ electricity consumption



УДК 620.9:551.581(571.51)

15.06.18 14:32
2652

Выходные сведения: Дулесова Н.В., Харитонова Д.Д. Интеллектуальный анализ данных электропотребления домохозяйствами сельской местности // Иннов: электронный научный журнал, 2018. №6 (39). URL: http://www.innov.ru/science/economy/intellektualnyy-analiz-dannykh-elek/

Авторы:
Дулесова Н.В. 1, Харитонова Д.Д. 2

1 к.э.н., доцент кафедры «Электроэнергетика», Хакасский технический институт – филиал ФГАОУ ВО «Сибирский федеральный университет», Абакан, Российская Федерация , dulesovanv@mail.ru

2 студентка 4-го курса бакалавриата по направлению «Электроэнергетика и электротехника», Хакасский технический институт – филиал ФГАОУ ВО «Сибирский федеральный университет», Абакан, Российская Федерация, wdizgraw@mail.ru.

Authors:
1 Dulesova N.V. , 2 Kharitonova D.D. 1 Ph.D. in Economic Sciences, Associate Professor at the Department of "Power Engineering", Khakas Technical Institute - Branch of Siberian Federal University Abakan, Russian Federation, dulesovanv@mail.ru 2 fourth year BA-student, specialty «Electroenergetics and Electrical Engineering», Khakas Technical Institute - Branch of Siberian Federal University, Abakan, Russian Federation, wdizgraw@mail.ru

Ключевые слова: электропотребление, потребитель электроэнергии, корреляция, интеллектуальный анализ данных

Keyword: electricity consumption, consumer of electricity, correlation, data mining

Аннотация: Практика хозяйственной деятельности предприятий электроэнергетики постоянно сталкивается с ситуациями, связанными с неучтенным потреблением электрической энергии, что приводит к нежелательным финансовым потерям. Выявление «узких» мест в электропотреблении домохозяйствами сельской местности требует внедрения качественного анализа, базирующегося на применении инструментов интеллектуального анализа данных (среди которых программное обеспечение SPSS Statistics 17.0).

В качестве объекта анализа рассматривалось помесячное электропотребление домохозяйствами (более 300) сельской местности в течение четырех лет с 2014 г. по 2017 г. одного из населенных пунктов Республики Хакасия. Среди статистических данных рассматривались: объем электропотребления домохозяйствами; количество проживающих; площадь домохозяйства; количество комнат и др. Имеющаяся информация сведена в единую базу данных, предварительная обработка которых позволила сформировать среднемесячные показания по каждому абоненту и определить удельные значения электропотребления.

Используя SPSS Statistics 17.0, оценивались корреляционные связи между электропотреблением и такими показателями как площадью помещения абонента, количеством лиц, проживающих в помещении абонента и количеством комнат. Полученные результаты показали наличие слабой корреляции между данными показателями, что свидетельствует о незначительном влиянии этих факторов. Существенными факторами при этом остаются сезонные, погодные условия и применение домохозяйствами электроприемников с высокой установленной мощностью (нагреватели воды, электронасосы воды, электропилы, сепараторы и др.).

Кластерный анализ с применением SPSS Statistics 17.0 позволил выявить роль в электропотреблении группы абонентов и каждого абонента в отдельности. Полученные графические результаты позволили выделить диапазон, в котором сосредоточено большинство абонентов, относящихся к добросовестным потребителям, а также обнаружены отдельные потребители, которые при наличии больших площадей домохозяйств имеют незначительное потребление электроэнергии.

Annotation: The electric power industry enterprises are constantly being challenged with situations related to unaccounted consumption of electric energy, which leads to undesirable financial losses. Identification of gaps in energy consumption needs an implementation of qualitative analysis which involves data mining tools (of which IBM SPSS Statistics Software).

The month-by-month electricity consumption of the village in the Republic of Khakassia for 2014 to 2017 was an object of analysis.
Among the statistical data, the following was considered: electricity consumption of households, number of occupants, area of the households, number of rooms, etc.

The available information was consolidated into a single database. Preliminary treatment of the data allowed to generate monthly average readings for every subscriber and define specific values of consumption.

The evaluation of the existence of a correlation between the households’ electricity consumption and other factors (number of occupants, household’s area, number of rooms and so on) was made by using SPSS Statistics.

The obtained results showed the presence of a weak correlation between these factors, and that indicates of these factors’ insignificant influence. Such factors as seasonal weather conditions and high power electrical appliances usage remain significant (water heaters, electric water pumps, electric saws, separators, etc.).

Cluster analysis using SPSS Statistics made it possible to identify the role of each subscriber and of a group of subscribers in the total electricity use.

The obtained graphic results allowed to distinguish the range where the conscientious subscribers are concentrated, and to find individual subscribers having large areas of households with insignificant consumption of electricity as well.

Интеллектуальный анализ данных электропотребления домохозяйствами сельской местности

Введение

Дочерние акционерные общества энергетики и электрификации ОАО РАО «ЕЭС России» и другие электроснабжающие организации постоянно сталкиваются в своей повседневной работе с ситуациями, связанными с неучтенным потреблением электрической энергии. По минимальным оценкам финансовые потери только предприятий ОАО РАО «ЕЭС России» от неучтенного электропотребления ежегодно составляют около 10 млрд. рублей [1]. В связи с ростом тарифов увеличивается и мотивация неучтенного потребления электрической энергии. На сегодняшний день существует немало практических, аналитических методов и моделей, способов прогнозирования [3,4,9-11,14] параметров электропотребления. Однако поиск способов выявления хищений и занижения потребления электроэнергии по-прежнему остается актуальной задачей.

Далее предлагается рассмотреть возможности применения информационной технологии, относящейся к интеллектуальному анализу данных и представить полученные результаты к возможному использованию на практике.

Представим краткую характеристику системы интеллектуального анализа данных. С точки зрения задачи обработки большого массива данных об электропотреблении, "интеллектуальный анализ данных" (Data Mining) представляет собой комплекс программных средств обнаружения и обработки различными методами необходимых знаний из баз данных. Среди разнообразия имеющихся в распоряжении Data Mining средств обработки, была выбрана программа SPSS Statistics 17.0 [6,7,13,16-20]. О полученных результатах обработки данных электропотребления отметим следующее.

Материалы и методы

1.                Одним из методов, принадлежащих интеллектуальному анализу данных можно отнести корреляционный анализ [5,12]. Его применение позволяет установить связь между параметрами, характеризующими зависимость электропотребления от многих факторов.

Корреляционный анализ – это метод обработки статистических данных, заключающийся в изучении коэффициентов корреляции между переменными. Другими словами, данный метод позволяет определить количественную взаимосвязь между несколькими параметрами исследуемой системы. Полученные значения коэффициентов корреляции подлежат сопоставлению с их табличными значениями, отраженными в табл. 1.

Таблица значений корреляции

Таблица 1


Коридор значений

Интерпретация

от 0 до 0,3

очень слабая

от 0,3 до 0,5

слабая

от 0,5 до 0,7

средняя

0,7 до 0,9

высокая

от 0,9 до 1

очень высокая


 

2.                Еще одним из методов анализа в данной работе был применен кластерный анализ [15]. С целью выявления роли каждого абонента в электропотреблении, выполнена процедура кластеризации, заключающаяся в разбиении множества абонентов на группы (или кластеры). Необходимость кластеризации обусловлена постановкой задачи выделения отдельных групп потребителей, относящихся, например, к группам, имеющим большую площадь домохозяйства и малое электропотребление.

Результаты и обсуждение

В качестве объекта анализа выбраны физические лица (более 300), являющиеся плательщиками за потребленную электроэнергию одного из населенных пунктов Республики Хакасия. Вся собранная информация была сведена в единую базу данных, предварительная обработка которых (на основе ежемесячных статистических данных) позволила сформировать среднемесячные показания по каждому абоненту и определить удельные значения электропотребления [2,8].

Для выполнения корреляционного анализа, предварительно получены графики электропотребления всеми домохозяйствами (данные об электропотреблении по месяцам в течение четырех лет с 2014 г. по 2017 г.) представленные на рис. 1, а также выделена информация о количестве комнат, количестве проживающих и площади домохозяйств каждого абонента.

Тренд электропотребления в течение нескольких лет сохраняет тенденцию сезонных колебаний. Поскольку потребление электрической энергии носит вероятностный характер, то проанализирован ряд факторов, которые, по мнению авторов статьи, влияют на электропотребление населением.

К таковым факторам отнесены площадь домохозяйств, количество проживающих и количество комнат.

 


Рисунок 1 – Потребление респондентами электрической энергии

 

Исходя из этого, в ходе работы над решением задачи выделены три подзадачи выявления корреляционной связи между: электропотреблением и площадью помещения абонента; электропотреблением и количеством лиц, проживающих в помещении абонента; между электропотреблением и количеством комнат в помещении абонента.

Результаты корреляционного анализа электропотребления:

-                   от площади помещения абонента – уровень корреляции не превышает 0,25;

-                   от количества лиц, проживающих в помещении абонента – уровень корреляции не превышает 0,117;

-                   от количества комнат в помещении абонента – уровень корреляции не превышает 0,06.

Из результатов следует, что зависимости между электропотреблением и количеством проживающих, количеством комнат и площадью очень слабые. Причем, корреляция между электропотреблением и площадью более существенная, чем между потреблением электроэнергии и количеством проживающих, а между электропотреблением и количеством комнат – самая несущественная.

Корреляционный анализ показал наличие слабой связи объемов электропотребления с рассматриваемыми показателями. Фактически существенным показателем остается сезонный фактор. Кроме этого в данных отсутствуют такие показатели как наличие электробойлеров, насосов подачи воды, механических станков различного назначения и др.

В процессе выполнения кластерного анализа получены следующие результаты. На рис. 2 представлены кластеры зависимости от удельного энергопотребления и площади домохозяйства по каждому абоненту.

   

Рисунок 2 – Графическое представление кластера от удельного энергопотребления от площади для каждого абонента

 

На данном изображении можно заметить, что есть определенный диапазон, в котором сосредоточено большинство домохозяйств, однако имеются потребители, которые при наличии больших площадей имеют незначительное потребление электроэнергии.

Для более точной кластеризации применена процедура выявления групп абонентов на основе трех показателей: среднемесячное электропотребление на человека, на комнату и на один квадратный метр площади. Результаты представлены на рис. 3.


Рисунок 3 – Трехмерное представление кластера от удельного электропотребления на человека, на комнату и на квадратный метр площади

 

Выводы

Полученные результаты свидетельствуют об очень низкой взаимосвязи между электропотреблением и выделенными факторами, как площадь домохозяйства, количество проживающих и количество комнат. Это означает, а именно: на электропотребление могут влиять благосостояние потребителя, метеорологические условия, сезонные факторы, оснащенность домохозяйства бытовой техникой и др.

Подтверждена значимость применения интеллектуального анализа данных в задаче влияния различных факторов (применительно к домохозяйствам сельской местности) на объемы электропотребления и выявления неблагонадежных абонентов.



Библиографический список


1. Отчет о социальной ответственности и корпоративной устойчивости ПАО «ФСК ЕЭС» за 2016 год [Электронный ресурс]. Режим доступа: http://www.fsk-ees.ru/temp/fsk_kso_2016.pdf
2. Биятто Е. В., Шарманова Г. Ю., Привалихина К. К. Зависимость электропотребления от влияния различных факторов. Анализ потребления электроэнергии по ОЭС и энергосистемам 2012–2014 гг. // «Молодой ученый». – 2015. – № 6. – С. 126-129. [Электронный ресурс] – Режим доступа: https://moluch.ru/archive/86/16264/
3. Дулесов А.С., Шилов А.В. Анализ инструментов краткосрочного прогнозирования электропотребления // «Современные наукоёмкие технологии». – 2016. – № 8. – С. 46-50. [Электронный ресурс] – Режим доступа: https://elibrary.ru/item.asp?id=26397725
4. Русина А.Г., Совбан Е.А., Филлипова Т.А., Худжасаидов Д.Х. Модели статистического анализа при планировании электропотребления и графиков нагрузки // сборник докладов «Мы продолжаем традиции российской традиции», том 1. – 2016. – С. 134-140. [Электронный ресурс] – Режим доступа: https://elibrary.ru/item.asp?id=27640711
5. Гржибовский А.М., Иванов С.В., Горбатова М.А. Корреляционный анализ данных с использованием программного обеспечения STATISTICA и SPSS // журнал «Наука и здравоохранение». – 2017. – № 1. – С. 7-36. [Электронный ресурс] – Режим доступа: https://elibrary.ru/item.asp?id=29222610
6. Осадчая С.М., Войкин Р.В. SPSS как инструмент анализа и описательной статистики факторов потребительского поведения // Вестник белгородского университета кооперации, экономики и права. – 2011. – № 1. – С. 225-234. [Электронный ресурс] – Режим доступа: https://elibrary.ru/item.asp?id=15856502
7. Никулина Ю.В. Анализ средств Data Mining // журнал «Экономика и социум» – 2015. – № 1-1(14). – С. 133-140. [Электронный ресурс] – Режим доступа: https://readera.ru/analiz-sredstv-data-mining-140110602
8. Репкина Н.Г. Исследование факторов, влияющих на точность прогнозирования суточного электропотребления // журнал «Известия высших учебных заведений. Электромеханика». – 2015. – № 2 (538). – С. 41-43. [Электронный ресурс] – Режим доступа: https://elibrary.ru/item.asp?id=23274386
9. Доманов В.И., Билалова А.И. Анализ различных математических моделей прогнозирования энергопотребления // сборник «Труды IX международной (XX Всероссийской) конференции по автоматизированному электроприводу АЭП-2016». – 2016. – С. 34-37. [Электронный ресурс] – Режим доступа: https://elibrary.ru/item.asp?id=28384993
10. Василенко В.П., Борисов М.Ю., Семёнов А.В. Прогнозирование отраслевого энергопотребления // Вестник российского государственного аграрного заочного университета. – 2013. – № 14. – С. 142-148. [Электронный ресурс] – Режим доступа: https://elibrary.ru/item.asp?id=21604318
11. Косенко Е.Ю., Номерчук А.Я. Исследование методов построения и анализа моделей энергопотребления // Известия Южного федерального университета. Технические науки. – 2008. [Электронный ресурс] – Режим доступа: https://cyberleninka.ru/article/n/issledovanie-metodov-postroeniya-i-analiza-modeley-energopotrebleniya
12. Кузнецова А.А., Муслимова Р.Р., Исханов Н.Н. Корреляционно-регрессионный анализ и возможность его применения при разработке прогнозов // научный журнал «Студенческий». – 2017. – № 20(20). [Электронный ресурс] – Режим доступа: https://sibac.info/journal/student/20/92186
13. Величко В.В. Сравнительный анализ статистических пакетов программ // Инновационная наука. – 2016. – № 5. [Электронный ресурс] – Режим доступа: https://cyberleninka.ru/article/v/sravnitelnyy-analiz-statisticheskih-paketov-programm
14. Кирпичникова И.М., Соломахо К.Л. Исследование методов прогнозирования электропотребления сбытового предприятия // журнал «Электротехнические системы и комплексы». – 2014. – № 3(24). [Электронный ресурс] – Режим доступа: https://cyberleninka.ru/article/n/issledovanie-metodov-prognozirovaniya-elektropotrebleniya-sbytovogo-predpriyatiya
15. Суслов С.А. Кластерный анализ: сущность, преимущества и недостатки // Вестник НГИЭИ. – 2010. – С. 51-57. [Электронный ресурс] – Режим доступа: https://cyberleninka.ru/article/v/klasternyy-analiz-suschnost-preimuschestva-i-nedostatki
16. Тифанова И.В. Использование статистического пакета SPSS в преподавании статистических дисциплин у студентов различных специальностей // Наука и современность. – 2010. – № 3-1. – С. 329-333. [Электронный ресурс] – Режим доступа: https://elibrary.ru/item.asp?id=21065920
17. Гефан Г.Д. Активное применение компьютерных технологий в преподавании вероятностно-статистических дисциплин в техническом ВУЗе // Вестник Красноярского государственного педагогического университета им. В.П. Астафьева. – 2014. – №. 1(27). – С. 57-61. [Электронный ресурс] – Режим доступа: https://elibrary.ru/item.asp?id=21262094
18. Волков Г.Г., Григорьев Е.А. Система компьютерной математики и статистические пакеты прикладных программ в учебном процессе экономического ВУЗа // Вестник Российского университета кооперации. – 2009. – № 1(3). – С. 229-240. [Электронный ресурс] – Режим доступа: https://elibrary.ru/item.asp?id=20252390
19. Панарина Д.В. Использование статистических пакетов в экономических информационных системах // Экономика и предпринимательство. – 2015. – № 12-2. – С. 192-194. [Электронный ресурс] – Режим доступа: https://elibrary.ru/item.asp?id=25138076
20. Глушаков А.И. Применение статистических программ и методов в медико-биологических научных исследованиях // Казанский медицинский журнал. – 2009. – № 4. – С. 554-555. [Электронный ресурс] – Режим доступа: https://elibrary.ru/item.asp?id=13043758


References


1. Otchet o social'noj otvetstvennosti i korporativnoj ustojchivosti PAO «FSK EES» za 2016 god [Elektronnyj resurs]. Rezhim dostupa: http://www.fsk-ees.ru/temp/fsk_kso_2016.pdf
2. Biyatto E. V., SHarmanova G. YU., Privalihina K. K. Zavisimost' elektropotrebleniya ot vliyaniya razlichnyh faktorov. Analiz potrebleniya elektroenergii po OES i energosistemam 2012–2014 gg. «Molodoy uchenyy». No 6. 2015. Pp. 126-129. [Elektronnyj resurs] – Rezhim dostupa: https://moluch.ru/archive/86/16264/
3. Dulesov A.S., SHilov A.V. Analiz instrumentov kratkosrochnogo prognozirovaniya elektropotrebleniya «Sovremennye naukoyomkie tekhnologii». 2016. No 8. Pp. 46-50. [Elektronnyj resurs] – Rezhim dostupa: https://elibrary.ru/item.asp?id=26397725
4. Rusina A.G., Sovban E.A., Fillipova T.A., Hudzhasaidov D.H. Modeli statisticheskogo analiza pri planirovanii elektropotrebleniya i grafikov nagruzki. Sbornik dokladov «My prodolzhaem tradicii rossijskoj tradicii», tom 1. 2016. Pp. 134-140. [Elektronnyj resurs] – Rezhim dostupa: https://elibrary.ru/item.asp?id=27640711
5. Grzhibovskij A.M., Ivanov S.V., Gorbatova M.A. Korrelyacionnyj analiz dannyh s ispol'zovaniem programmnogo obespecheniya STATISTICA i SPSS. Zhurnal «Nauka i zdravoohranenie». 2017. No 1. Pp. 7-36. [Elektronnyj resurs] – Rezhim dostupa: https://elibrary.ru/item.asp?id=29222610
6. Osadchaya S.M., Vojkin R.V. SPSS kak instrument analiza i opisatel'noj statistiki faktorov potrebitel'skogo povedeniya. Vestnik belgorodskogo universiteta kooperacii, ekonomiki i prava. 2011. No 1. Pp. 225-234. [Elektronnyj resurs] – Rezhim dostupa: https://elibrary.ru/item.asp?id=15856502
7. Nikulina Yu.V. Analiz sredstv Data Mining. Zhurnal «Ekonomika i socium». 2015. No 1-1(14). Pp. 133-140. [Elektronnyj resurs] – Rezhim dostupa: https://readera.ru/analiz-sredstv-data-mining-140110602
8. Repkina N.G. Issledovanie faktorov, vliyayuschih na tochnost' prognozirovaniya sutochnogo elektropotrebleniya. Zhurnal «Izvestiya vysshih uchebnyh zavedenij. Elektromekhanika». 2015. No 2(538). Pp. 41-43. [Elektronnyj resurs] – Rezhim dostupa: https://elibrary.ru/item.asp?id=23274386
9. Domanov V.I., Bilalova A.I. Analiz razlichnyh matematicheskih modelej prognozirovaniya energopotrebleniya. Sbornik «Trudy IX mezhdunarodnoj (XX Vserossijskoj) konferencii po avtomatizirovannomu elektroprivodu AEP-2016». 2016. Pp. 34-37. [Elektronnyj resurs] – Rezhim dostupa: https://elibrary.ru/item.asp?id=28384993
10. Vasilenko V.P., Borisov M.Yu., Semyonov A.V. Prognozirovanie otraslevogo energopotrebleniya. Vestnik rossijskogo gosudarstvennogo agrarnogo zaochnogo universiteta. 2013. No 14. Pp. 142-148. [Elektronnyj resurs] – Rezhim dostupa: https://elibrary.ru/item.asp?id=21604318
11. Kosenko E.Yu., Nomerchuk A.Ya. Issledovanie metodov postroeniya i analiza modelej energopotrebleniya. Izvestiya Yuzhnogo federal'nogo universiteta. Tekhnicheskie nauki. 2008. [Elektronnyj resurs] – Rezhim dostupa: https://cyberleninka.ru/article/n/issledovanie-metodov-postroeniya-i-analiza-modeley-energopotrebleniya
12. Kuznecova A.A., Muslimova R.R., Iskhanov N.N. Korrelyacionno-regressionnyj analiz i vozmozhnost' ego primeneniya pri razrabotke prognozov. Nauchnyj zhurnal «Studencheskij». 2017. No 20(20). [Elektronnyj resurs] – Rezhim dostupa: https://sibac.info/journal/student/20/92186
13. Velichko V.V. Sravnitel'nyj analiz statisticheskih paketov program. Innovacionnaya nauka. 2016. No 5. [Elektronnyj resurs] – Rezhim dostupa: https://cyberleninka.ru/article/v/sravnitelnyy-analiz-statisticheskih-paketov-programm
14. Kirpichnikova I.M., Solomaho K.L. Issledovanie metodov prognozirovaniya elektropotrebleniya sbytovogo predpriyatiya. Zhurnal «Elektrotekhnicheskie sistemy i kompleksy». 2014. No 3(24). [Elektronnyj resurs] – Rezhim dostupa: https://cyberleninka.ru/article/n/issledovanie-metodov-prognozirovaniya-elektropotrebleniya-sbytovogo-predpriyatiya
15. Suslov S.A. Klasternyj analiz: suschnost', preimuschestva i nedostatki. Vestnik NGIEI. 2010. Pp. 51-57. [Elektronnyj resurs] – Rezhim dostupa: https://cyberleninka.ru/article/v/klasternyy-analiz-suschnost-preimuschestva-i-nedostatki
16. Tifanova I.V. Ispol'zovanie statisticheskogo paketa SPSS v prepodavanii statisticheskih disciplin u studentov razlichnyh special'nostej. Nauka i sovremennost'. 2010. No 3-1. Pp. 329-333. [Elektronnyj resurs] – Rezhim dostupa: https://elibrary.ru/item.asp?id=21065920
17. Gefan G.D. Aktivnoe primenenie komp'yuternyh tekhnologij v prepodavanii veroyatnostno-statisticheskih disciplin v tekhnicheskom VUZe. Vestnik Krasnoyarskogo gosudarstvennogo pedagogicheskogo universiteta im. V.P. Astaf'eva. 2014. No 1(27). Pp. 57-61. [Elektronnyj resurs] – Rezhim dostupa: https://elibrary.ru/item.asp?id=21262094
18. Volkov G.G., Grigor'ev E.A. Sistema komp'yuternoj matematiki i statisticheskie pakety prikladnyh programm v uchebnom processe ekonomicheskogo VUZa. Vestnik Rossijskogo universiteta kooperacii. 2009. No 1(3). Pp. 229-240. [Elektronnyj resurs] – Rezhim dostupa: https://elibrary.ru/item.asp?id=20252390
19. Panarina D.V. Ispol'zovanie statisticheskih paketov v ekonomicheskih informacionnyh sistemah. Ekonomika i predprinimatel'stvo. 2015. No 12-2. Pp. 192-194. [Elektronnyj resurs] – Rezhim dostupa: https://elibrary.ru/item.asp?id=25138076
20. Glushakov A.I. Primenenie statisticheskih programm i metodov v mediko-biologicheskih nauchnyh issledovaniyah. Kazanskij medicinskij zhurnal. 2009. No 4. Pp. 554-555. [Elektronnyj resurs] – Rezhim dostupa: https://elibrary.ru/item.asp?id=13043758


  Яндекс.ВиджетINNOV

архив: 2013  2012  2011  1999-2011 новости ИТ гость портала 2013 тема недели 2013 поздравления