INNOV.RU | технологии Blockchain в экономике; ICO
Иннов: электронный научный журнал
 

Информационная система для расчета риска употребления наркотиков по персональным данным

Information system for calculation of risk of the use of drugs for personal data



УДК 004.942

23.07.18 7:23
599

Выходные сведения: Пинчук Я.И., Параскевуполо О.Р., Белова И.М. Информационная система для расчета риска употребления наркотиков по персональным данным // Иннов: электронный научный журнал, 2018. №7 (40). URL: http://www.innov.ru/science/tech/informatsionnaya-sistema-dlya-rasch/

Авторы:
Пинчук Я.И. 1, Параскевуполо О.Р. 2, Белова И.М. 3

1 студент 4-го курса бакалавриата по направлению «Информатика и вычислительная техника», федеральное государственное бюджетное образовательное учреждение высшего образования «Московский политехнический университет», Москва, Российская Федерация (107023, г. Москва, ул. Б. Семёновская, 38), e-mail: yarpior96@mail.ru

2 к.ф.-м.н., доцент кафедры ВМ-2, РТУ МИРЭА, Москва, Российская Федерация (119454, г. Москва, проспект Вернадского, 78), e-mail: Olgarigpar@gmail.com

3 к.ф.-м.н., доцент кафедры ВМ-2, РТУ МИРЭА, Москва, Российская Федерация (119454, г. Москва, проспект Вернадского, 78), e-mail: irbelova1@gmail.com

Authors:
Pinchuk Y.I. 1, Paraskevopulo O. R. 2, Belova I. M. 3

1 student of the 4th year of bachelor's degree in “Computer science and engineering” , Federal state budgetary educational institution of higher education of Moscow Polytechnic University, Moscow, Russian Federation (107023, Moscow , street B. Semenovskaya, 38), e-mail: yarpior96@mail.ru

2 Ph.D.., assistant professor of dept. Higher Mathematics -2, Russian technological University of MIREA, Moscow, Russian Federation (119454, Moscow, Prospekt Vernadskogo, 78), e-mail: Olgarigpar@gmail.com

3 Ph.D., assistant professor of dept. Higher Mathematics -2, Russian technological University of MIREA, Moscow, Russian Federation(119454, Moscow, Prospekt Vernadskogo, 78), e-mail: irbelova1@gmail.com

Ключевые слова: java, наркотик, употребление наркотиков, нейронная сеть, большая пятерка персональных черт, алгоритм обратного распространения ошибки

Keyword: java, narcotic, drug use, neural network, large five personal features, algorithm for back propagation of error

Аннотация: Употребление наркотиков и наркомания являются серьезной глобальной проблемой. Оно включает в себя несколько факторов риска, которые определяются как атрибуты, характеристики или события в жизни человека, которые повышают риск употребления наркотиков. Некоторые факторы связаны с началом употребления наркотиков. Это такие факторы как: психологические, социальные, индивидуальные, факторы окружающей среды и экономические факторы. Эти факторы также связаны с некоторыми чертами личности человека.

Данная работа посвящена разработке системы для расчета риска употребления наркотиков по персональным данным. Для сбора персональных данных использовался опросник, который включал в себя: Большую пятерку персональных черт(NEO-FFI-R), импульсивность(BIS-11), искажение импульсивного ощущения(ImpSS), а также демографическую информацию. В результате анализа литературных источников были выявлены недостатки в разработанных информационных системах, предназначенных для расчета риска употребления наркотиков по персональным данным.

Для определения риска употребления наркотиков была использована искусственная нейронная сеть прямого распространения. Для обучения сети использовался алгоритм обратного распространения ошибки.

Набор данных, используемый для тренировки нейронной сети, содержит информацию об употреблении 18 различных психоактивных веществ, воздействующих на центральную нервную систему.

Точность используемой нейронной сети превышает точность используемых в литературе методов «К ближайших соседей», «дерево решений», «логистическая регрессия».

Annotation: Drug use and drug addiction are a serious global problem. It includes several risk factors, which are defined as attributes, characteristics, or events in a person's life that increase the risk of drug use. Some factors are related to the onset of drug use. These are such factors as: psychological, social, individual, environmental factors and economic factors. These factors are also associated with certain features of a person's personality.

This work deals with the development of a system for calculating the risk of drug use on personal data. For personal data collection was used a questionnaire that included the Big five personal traits(NEO-FFI-R), impulsivity(BIS-11), distortion impulsive sensations(ImpSS), and demographic information. As a result of the analysis of literature sources, deficiencies in the developed information systems designed to calculate the risk of drug use on personal data were identified. An artificial neural network was used to determine the risk of drug use. For training the network used back-propagation algorithm errors.

The data set used to train the neural network contains information on the use of 18 different psychoactive substances that affect the central nervous system.

The accuracy of the neural network used exceeds the accuracy of methods used in the literature "To nearest neighbors", "decision tree", "logistic regression".

Информационная система для расчета риска употребления наркотиков по персональным данным

Введение

Наркомания — глобальная проблема 21 века. По оценкам ООН в мире насчитывается 200 млн. человек, злоупотребляющих наркотиками, в том числе 163 млн. - потребители препаратов конопли, 34 млн. – амфитоминоподобных психостимуляторов, 8 млн. – экстази, 14 млн. – кокаина, 15 млн. – опиантов, из них 10 млн. – героина. Данные цифры далеко не полные, так как не учитывают полинаркоманов, потребляющих различные виды наркотических веществ.

Употребление наркотиков это опасное поведение, которое не происходит в изоляции. Оно является важным фактором повышения риска слабого здоровья, является причиной ранней смертности и болезненности, а также напрямую влияет на развитие общества [1, 2, 3]. Употребление наркотиков и наркомания являются серьезной глобальной проблемой. Оно включает в себя несколько факторов риска, которые определяются как атрибуты, характеристики или события в жизни человека, которые повышают риск употребления наркотиков. Некоторые факторы связаны с началом употребления наркотиков. Это такие факторы как: психологические, социальные, индивидуальные, факторы окружающей среды и экономические факторы [4, 5]. Эти факторы также связаны и некоторыми чертами личности человека [6, 7].

Из всего вышесказанного можно сделать вывод, что личностные факторы коррелируют с употреблением наркотиков, соответственно персональный профиль личности играет большую роль в определении риска употребления наркотиков.

Актуальность данной работы заключается в необходимости понимания риска употребления наркотиков индивидуально для каждого человека. Данная информация может помочь в формировании превентивных мер по противодействию развития этой болезни.

Обзор существующих решений и постановка задачи.

Большинство психологов согласны, что «Пятифакторная модель личности» (далее FFM) является наиболее полной и адаптивной системой для понимания индивидуальных отличий человека [8]. FFM состоит из 5 факторов личности: Нейротисизм(N), Экстраверсия (E), Открытость к опыту (O), Согласованность (А), Добросовестность (C). Неоднократно была выявлена зависимость между этими факторами и употреблением определенных наркотиков [9, 10, 11, 12, 13, 14, 15, 16].

Было проведено исследование группой ученых, которые изучали влияние персональных данных человека и демографической информации на употребление наркотиков. Описание параметров личности и используемых данных содержится в работе [8]. Расчет риска проводился с помощью таких алгоритмов как: «К ближайших соседей», «дерево решений», «логистическая регрессия» и т.д. Наибольшая точность расчета для отдельных видов наркотиков составляла приблизительно 75%, для некоторых видов точность была порядка 50%. Однако процесс расчета не был автоматизирован, а также отсутствовала возможность расчета риска употребления наркотиков для какого-либо человека индивидуально. Расчет риска является по своей сути задачей классификации. То есть нам необходимо вычислить вероятность с которой пользователь попадет в одну из групп: «пользователи» и «не пользователи» для каждого из наркотиков для различных классификаций (decade-based, year-based, month-based, week-based). С данной задачей хорошо справляется искусственная нейронная сеть, использующаяся в этой работе.

Целью данной работы является создание системы для расчета риска употребления наркотиков по персональным данным с использованием нейросети.

Для достижения поставленной цели необходимо было выполнить ряд задач:

1) Разработать структуру базы данных

2) Преобразовать входные данные для их дальнейшего использования.

3) Разработать и обучить нейронную сеть для расчета риска.

4) Разработать web-интерфейс для взаимодействия пользователей с системой.

Выбор используемого языка и технологий

Программная часть информационной системы была разработана на языке Java. Java – сильно типизированный объектно-ориентированный язык программирования. Программа написанная на языке Java транслируется в байт-код, который затем выполняется виртуальной машиной Java (jvm). Преимуществом такого способа выполнения программ является полная независимость байт-кода от операционной системы и оборудования. Программа на java может быть запущена на любой машине на которой установлена jvm.

Для разработки серверной части информационной системы использовался фреймворк Spring, а точнее Spring MVC

Для хранения данных в разработанной системе использовалась СУБД PostgreSQL.

Данные, полученные в результате тестирования необходимо было преобразовать, для этого использовался категориальный метод главных компонент [17].

Расчет риска употребления наркотиков.

В данной работе для расчета риска употребления наркотиков используется искусственная нейронная сеть прямого распространения, которая называется многослойный персептрон. Разработанная нейронная сеть содержит 3 скрытых уровня. В данной нейронной сети используются следующие слои:

Dropout – данный слой используется для устранения переобучения нейронной сети.

Dense - плотносвязанный слой. Связывает выход нейрона со всеми входами нейронов следующего уровня.

Output – выходной слой.

Одним из самых популярных методов обучения многослойных персептронов, которые также называются нейронными сетями прямого распространения, является алгоритм обратного распространения ошибки. Данный алгоритм реализуется двумя проходами по всем слоям нейронной сети: прямой проход и обратный проход. Прямой проход предполагает распространение входного вектора по каждому слою начиная с входного. В итоге после данного прохода сформируется набор выходных сигналов. Этот набор – реакция нейронной сети на эти входные параметры. Синаптические веса нейронной сети во время прямого прохода не изменяются. Вторым этапом данного алгоритма является обратный проход. Синаптические веса во время обратного прохода изменяются в соответствии с правилом «коррекции ошибок». Его суть заключается в следующем: из желаемого выхода нейронной сети мы вычитаем полученный, тем самым мы получаем сигнал ошибки. Сигнал ошибки распространяется в обратном направлении от направления синаптических связей. Целью данного алгоритма является настройка синаптических весов для максимального приближения фактического результата к желаемому.

При конфигурации нейронной сети указываются такие параметры как: количество эпох, количество итераций, функция активации используемая по умолчанию, алгоритм оптимизации, learning rate и т.д. Функцией активации выходного слоя является softmax [18] а скрытых слоёв — ReLU [19].

Набор для обучения составляет 70% от всех данных. Остальные 30% процентов находятся в тестовом наборе. Для каждого из наркотиков тренируется и сохраняется своя нейронная сеть. Обученные модели нейронных сетей хранятся в формате json [20].

Веб-интерфейс системы

Сбор персональных данных производится через веб-интерфейс. Основной его частью является страница для сбора данных от пользователя. На скриншоте ниже представлена часть опросника для сбора персональных данных.



Данные о пользователе включают в себя: демографическую информацию (возрастную группу, пол, образование, страну проживания, национальность), а также личностные характеристики, которые собираются с помощью следующих тестов: NEO-FFI, BIS-11, ZKPQ.

После ввода данных запрос попадает в контроллер (класс, который отвечает за обработку запроса) в котором формируется класс , содержащий введенные данные. Затем производится пересчет данных теста, формируется экземпляр класса PersonalData, производится сохранение введенных данных в БД. После этого проводится расчет риска употребления наркотиков по введенным данным. Результат расчета передается на страницу отображения результатов. На приведенном скриншоте отображены результаты работы системы для алкоголя.


Аналогичные диаграммы можно построить для любого рассматриваемого наркотика.

Обсуждение результатов

Для тренировки нейронной сети использовались данные заимствованные из работы [8]. Они содержат такие параметры как: N, E, O, A, C из NEO-FFI, Impulsivity из BIS-11, sensation seeking(SS) из ImpSS, возрастную группу, пол, национальность, страна проживания, уровень образования. Также данные содержат информацию об употреблении 18 различных различных психоактивных наркотиков включая: алкоголь, амфетамины, амил нитриты, бензодиазепины, каннабис, шоколад, кокаин, кофеин, крэк, экстази, героин, кетамин, легальные вещества, ЛСД, метадон, грибы, никотин, VSA и один фиктивный наркотик для выявления недостоверных данных. Информация об употреблении наркотиков делится на 7 классов: никогда не употреблял, употреблял больше 10 лет назад, употреблял в последние 10 лет, употреблял в последний год, употреблял в последний месяц, употреблял на этой неделе, употреблял вчера.

В качестве тестовой выборки использовались 30% всех данных. Точность нейронной сети для тестовых данных показана в таблице ниже.

Таблица 1

Наркотик

Точность

Алкоголь

0,6265

Амфетамин

0,6035

Амилнитриты

0,6873

Бензодиазепины

0,7141

Коффеин

0,7456

Каннабис

0,5415

Шоколад

0,7576

Кокаин

0,5724

Крэк

0,8516

Экстази

0,5424

Героин

0,8481

Кетамин

0,7756

Legal highs

0,7954

ЛСД

0,7583

Метадон

0,7580

Грибы

0,5000

Никотин

0,5786

VSA

0,9929

 

Как видно из данной таблицы наилучшие результаты достигнуты для Legal highs, VSA (в работе [8] точность – 75%) , героина и крэка (в работе [8] точность менее 75% для обоих наркотиков). Из-за неравномерности данных присутствуют элементы с достаточно низкими показателями, такие как: грибы, амфетамин, канабис и экстази.

Можно сделать вывод о том, что данная система справляется со своей задачей достаточно хорошо.

Заключение

В результате была спроектирована и разработана система по расчету риска употребления наркотиков по персональным данным. Персональные данные включают в себя демографическую информацию, показатели N, E, O, A, C из опросника NEO-FFI, «импульсивность» из опросника BIS-11, «в поисках сенсации» из ZKPQ [21]. Сбор данных и отображение результатов происходит через веб-интерфейс. Была разработана нейронная сеть прямого распространения, которая также называется многослойным персептроном. Обучалась данная сеть алгоритмом обратного распространения ошибки. В сети присутствует Dopout-слой для избежания переобучения. В качестве функции активации в скрытых слоях используется ReLU, что позволяет избежать эффекта сжатия, который характерен для сигмоида. Точность такой нейронной сети для некоторых наркотиков превышает точность классификаторов работе[8]. Например, для кетамина точность составляет 77,56%, для крэка 85,16%, для героина 84,81%, для legal highs 79,54%, для VSA 99,29%, для ЛСД 75,83%, для метадона 75,80%.



Библиографический список


1. Kleiman MA, Caulkins JP, Hawken A. «Drugs and Drug Policy: What Everyone Needs to Know». Oxford University Press; 2011.
2. McGinnis JM, Foege WH. «Actual causes of death in the United States», Journal of the American Medical Association. 1993; 270(18):2207–2212.
3. Sutina AR, Evans MK, Zonderman AB. Personality traits and illicit substances: the moderation role of poverty. Drug and Alcohol Dependence. 2013; 131:247–251.
4. Cleveland MJ, Feinberg ME, Bontempo DE, Greenberg MT. «The role of risk and protective factors in substance use across adolescence». Journal of Adolescent Health. 2008; 43(2):157–164.
5. WHO. Prevention of mental disorders: Effective interventions and policy options: Summary report. Geneva: World Health Organization; 2004.
6. Dubey C, Arora M, Gupta S, Kumar B. «Five factor correlates: A comparison of substance abusers and non-substance abusers». Journal of the Indian Academy of Applied Psychology. 2010; 36(1):107–114.
7. Bogg T, Roberts BW.Conscientiousness and health-related behaviors: A meta-analysis of the leading behavioral contributors to mortality. Psychological Bulletin. 2004.
8. Elaine Fehrman, Evgeny M. Mirkes, Awaz K. Muhammad,, Vincent Egan3, Alexander N. Gorban «The Five Factor model of personality and evaluation of drug consumption risk» Conference of the International Federation of Classification Societies University of Bologna 8th July 2015.
9. Roncero C, Daigre C, Barral C, Ros-Cucurull E, Grau-Lopez L, Rodrıguez-Cintas L, Tarifa N, Casas M, Valero S. Neuroticism associated with cocaine-induced psychosis in cocaine-dependent patients: a cross-sectional observational study. PloS one. 2014.
10. Vollrath M, Torgersen S. Who takes health risks? a probe into eight personality types. Personality and Individual Differences. 2002; 32(7):1185–1197.
11. Flory K, Lynam D, Milich R, Leukefeld C, Clayton R. The relations among personality, symptoms of alcohol and marijuana abuse, and symptoms of comorbid psychopathology: results from a community sample. Experimental and Clinical Psychopharmacology. 2002.
12. Andreassen CS, Griffiths MD, Gjertsen SR, Krossbakken E, Kvam S, Pallesen S. The relationships between behavioral addictions and the five-factor model of personality. Journal of Behavioral Addictions. 2013.
13. Terracciano A, L ́ockenhoff CE, Crum RM, Bienvenu OJ, Costa PT. Five-Factor Model personality profiles of drug users. Bmc Psychiatry. 2008.
14. Turiano NA, Whiteman SD, Hampson SE, Roberts BW, Mroczek DK. Personality and substance use in midlife: Conscientiousness as a moderator and the effects of trait change. Journal of research in personality. 2012.
15. Stewart SH, Devine H. Relations between personality and drinking motives in young adults. Personality and Individual Differences. 2000.
16. Costa PT, MacCrae RR. Revised NEO-Personality Inventory (NEO PI-R) and NEO Five-Factor Inventory (NEO FFI): Professional manual. Odessa, FL: Psychological Assessment Resources; 1992.
17. Meulman J.J., Optimal scaling methods for multivariate categorical data analysis, SPSS White papers, Chicago, 1998 -
18. http://apsheronsk.bozo.ru/Neural/Lec2.htm (дата доступа 16.07.2018)
19.http://datareview.info/article/eto-nuzhno-znat-klyuchevyie-rekomendatsii-po-glubokomu-obucheniyu-chast-2 (дата доступа 16.07.2018)
20. https://www.json.org/json-ru.html (дата доступа 16.07.2018)
21.https://www.psytoolkit.org/survey-library/zkpq-50-cc.html (дата доступа 16.07.2018)


References


1. Kleiman MA, Caulkins JP, Hawken A. «Drugs and Drug Policy: What Everyone Needs to Know». Oxford University Press; 2011.
2. McGinnis JM, Foege WH. «Actual causes of death in the United States», Journal of the American Medical Association. 1993; 270(18):2207–2212.
3. Sutina AR, Evans MK, Zonderman AB. Personality traits and illicit substances: the moderation role of poverty. Drug and Alcohol Dependence. 2013; 131:247–251.
4. Cleveland MJ, Feinberg ME, Bontempo DE, Greenberg MT. «The role of risk and protective factors in substance use across adolescence». Journal of Adolescent Health. 2008; 43(2):157–164.
5. WHO. Prevention of mental disorders: Effective interventions and policy options: Summary report. Geneva: World Health Organization; 2004.
6. Dubey C, Arora M, Gupta S, Kumar B. «Five factor correlates: A comparison of substance abusers and non-substance abusers». Journal of the Indian Academy of Applied Psychology. 2010; 36(1):107–114.
7. Bogg T, Roberts BW.Conscientiousness and health-related behaviors: A meta-analysis of the leading behavioral contributors to mortality. Psychological Bulletin. 2004.
8. Elaine Fehrman, Evgeny M. Mirkes, Awaz K. Muhammad,, Vincent Egan3, Alexander N. Gorban «The Five Factor model of personality and evaluation of drug consumption risk» Conference of the International Federation of Classification Societies University of Bologna 8th July 2015.
9. Roncero C, Daigre C, Barral C, Ros-Cucurull E, Grau-Lopez L, Rodrıguez-Cintas L, Tarifa N, Casas M, Valero S. Neuroticism associated with cocaine-induced psychosis in cocaine-dependent patients: a cross-sectional observational study. PloS one. 2014.
10. Vollrath M, Torgersen S. Who takes health risks? a probe into eight personality types. Personality and Individual Differences. 2002; 32(7):1185–1197.
11. Flory K, Lynam D, Milich R, Leukefeld C, Clayton R. The relations among personality, symptoms of alcohol and marijuana abuse, and symptoms of comorbid psychopathology: results from a community sample. Experimental and Clinical Psychopharmacology. 2002.
12. Andreassen CS, Griffiths MD, Gjertsen SR, Krossbakken E, Kvam S, Pallesen S. The relationships between behavioral addictions and the five-factor model of personality. Journal of Behavioral Addictions. 2013.
13. Terracciano A, L ́ockenhoff CE, Crum RM, Bienvenu OJ, Costa PT. Five-Factor Model personality profiles of drug users. Bmc Psychiatry. 2008.
14. Turiano NA, Whiteman SD, Hampson SE, Roberts BW, Mroczek DK. Personality and substance use in midlife: Conscientiousness as a moderator and the effects of trait change. Journal of research in personality. 2012.
15. Stewart SH, Devine H. Relations between personality and drinking motives in young adults. Personality and Individual Differences. 2000.
16. Costa PT, MacCrae RR. Revised NEO-Personality Inventory (NEO PI-R) and NEO Five-Factor Inventory (NEO FFI): Professional manual. Odessa, FL: Psychological Assessment Resources; 1992.
17. Meulman J.J., Optimal scaling methods for multivariate categorical data analysis, SPSS White papers, Chicago, 1998 -
18. http://apsheronsk.bozo.ru/Neural/Lec2.htm (дата доступа 16.07.2018)
19.http://datareview.info/article/eto-nuzhno-znat-klyuchevyie-rekomendatsii-po-glubokomu-obucheniyu-chast-2 (дата доступа 16.07.2018)
20. https://www.json.org/json-ru.html (дата доступа 16.07.2018)
21.https://www.psytoolkit.org/survey-library/zkpq-50-cc.html (дата доступа 16.07.2018)


  Яндекс.ВиджетINNOV

архив: 2013  2012  2011  1999-2011 новости ИТ гость портала 2013 тема недели 2013 поздравления