Возможность применения алгоритмов машинного обучения для анализа чрезвычайных ситуаций

Possibility of application of machine learning algorithms for analysis of emergency situations

Аннотация: Рассмотрены алгоритмы машинного обучения. Предложено применение алгоритмов машинного обучения для максимально эффективного анализа баз данных по чрезвычайным ситуациям. Дано описание варианта комплексного использования алгоритмов машинного обучения для анализа чрезвычайных ситуаций.

Ключевые слова: чрезвычайные ситуациипревентивные меры реагированиямашинное обучение

Автор:Третьяков Никита Алексеевич |

Чрезвычайная ситуация - обстановка на определенной территории, сложившаяся в результате аварии, опасного природного явления, катастрофы, стихийного или иного бедствия, которые могут повлечь или повлекли за собой человеческие жертвы, ущерб здоровью людей или окружающей среде, значительные материальные потери и нарушение условий жизнедеятельности людей [1].

Согласно государственного доклада “О состоянии защиты населения и территорий Российской Федерации от чрезвычайных ситуаций природного и техногенного характера в 2019 году” [2] общий материальный ущерб составил около 20,5 млрд рублей, пострадало около 121 тысяч человек. В сравнении с 2018 годом наблюдается рост и масштаб чрезвычайных ситуаций, материальный ущерб вырос почти в 2 раза, количество пострадавших людей выросло более чем в 2 раза, количество погибших человек выросло более чем в 4 раза.

В связи с этим возникает необходимость не только в улучшении методов предупреждения и борьбы с чрезвычайными ситуациями, но и в ускоренном анализе постоянно накапливающихся данных. Так какот больших данных нет пользы, если их нельзя превратить в знание” [3].

Алгоритмы машинного обучения, основываясь на предыдущем опыте, способны качественно и оперативно оценивать новую поступающую информацию. К примеру алгоритм gpt-3 почти дошел по качеству понимания прочитанного текста до способностей человека, а точность определение рака нейросетями медицинского направления дошла до 99.5%. Применение алгоритмов машинного обучение для анализа чрезвычайных ситуаций должно облегчить работу аналитикам, диспетчерам, а в перспективе уменьшить материальный ущерб, количество человеческих жертв и чрезвычайных ситуаций за счёт превентивных мер реагирования.

В качестве примера одного из алгоритмов, который может быть эффективно использован, предлагается Random forest (RF, Случайные леса), являющийся средством поддержки принятия решений. Данный ансамблевый метод использует коллективный интеллект. Каждое отдельно взятое дерево выдаёт крайне неточный ответ, а сам лес выдаёт довольно точный результат. Однако нельзя утверждать, что данный алгоритм способен мыслить [4], он не способен заменить человека и может выступать только в качестве дополнительного инструмента при работе лица, принимающего решения.

Случайные леса – ансамбль из нескольких деревьев решений. Структура дерева решений представляет из себя так называемые листья и ветки (рёбра) (рис.1).

 

Рис. 1. Пример дерева решений

В зависимости от цели применения деревья решений бывают двух основных типов: дерево для классификации и дерево для регрессии. Выбор параметра для разделения в листе, как правило, производится исходя из теоретико-информационного критерия и основан на информационной энтропии

H= -i=1nNiNlog(NiN) ,

где n - число классов в исходном подмножестве, Ni - число примеров i -го класса, N - общее число примеров в подмножестве.

Таким образом, выбор оптимального параметра производится исходя из того, где будет максимальное уменьшение энтропии (неопределённости). Преимущества данного алгоритма состоят в том, что он может быть достаточно просто интерпретирован, интуитивно понятен человеку и не требует большой обработки данных. Среди недостатков следует выделить то, что в процессе построения дерева могут создаваться крайне сложные конструкции. Порой нельзя обеспечить эффективность всего дерева целиком за счёт того, что применяется локальное оптимальное решение в листе. Однако подобные недостатки решаются за счёт увеличения количества деревьев и использованию алгоритма RF.

  При применении алгоритмов машинного обучения для анализа чрезвычайных ситуация источниками входящей информации выступают базы данных МЧС (рис. 2). Алгоритмы распределяют параметры на новые базы данных, исходя из дальнейшего назначения обрабатываемой информации. В дальнейшем с каждой сформированной базой данных работает свой комплекс алгоритмов машинного обучения. Каждый отдельно взятый алгоритм комплекса решает свою задачу в данной области. Итог работы алгоритмов передаётся в систему поддержки принятия решений, а обработанные данные поступают на повторное обучение алгоритмов.

 

Рис. 2. Вариант комплексного использования алгоритмов

машинного обучения для анализа чрезвычайных ситуаций

Комплексное применение алгоритмов машинного обучения в составе систем поддержки принятия решений может позволить максимально эффективно анализировать базы (банки) данных чрезвычайных ситуаций. При этом результаты работы алгоритмов машинного обучения должны носить рекомендательный характер.

Литература

  1. ФЕДЕРАЛЬНЫЙ ЗАКОН “О защите населения и территорий от чрезвычайных ситуаций природного и техногенного характера” (с изменениями на 23 июня 2020 года). Статья 1.
  2. Государственный доклад «О состоянии защиты населения и территорий Российской Федерации от чрезвычайных ситуаций природного и техногенного характера в 2019 году». Часть 1, 9-11 с.
  3. Педро Домингос Верховный алгоритм: как машинное обучение изменит наш мир. М.: изд-во Манн, Иванов и Фербер. 2016. 35 с.
  4. ГОСТ Р 43.0.21-2020 Информационное обеспечение техники и операторской деятельности. Сознание и самосознание.