1 of 11

Применение методов машинного обучения при разработке технологии детектирования пожаров по данным прибора МСУ-МР с российского спутника Метеор-М-2-2

Лозин Дмитрий Владиславович

Московский государственный университет имени

М.В. Ломоносова

Факультет космических исследований

Институт космических исследований РАН

Москва

2023

Курс «Нейронные сети и их применение в научных исследованиях»

2 of 11

Актуальность проблемы и основная задача

  • Детектирование пожаров по данным спутников ДЗЗ – технология, обеспечивающая возможность круглосуточного дистанционного мониторинга пожаров и оперативного автоматизированного контроля лесопожарной обстановки на всей территории России
  • Одним из наиболее устойчивых и надежных алгоритмов детектирования пожаров по спутниковым данным является алгоритм MOD14, рассчитанный на работу с данными прибора MODIS, установленного на спутниках TERRA и AQUA.
  • Большой интерес представляет исследование возможностей детектирования пожаров по данным с приборов, для которых еще не было разработано подобных алгоритмов.

Разработка методов детектирования пожаров по данным прибора МСУ-МР

Лесной пожар в сибирской тайге

3 of 11

Задача

Разработка методов детектирования пожаров по данным с прибора МСУ-МР, установленном на отечественном метеорологическом спутнике Метеор-М №2-2 с использованием методов машинного обучения

Возможные способы применения:

  • классификация табличных данных со спектральными параметрами пикселей (Random Forest)
  • валидация результатов работы пороговой модели

Разработка методов детектирования пожаров по данным прибора МСУ-МР

Основная целевая аппаратура

космического аппарата «Метеор-М» №2-2

4 of 11

Построение обучающей выборки (табличные данные)

  • Положительная выборка составлялась из наборов параметров, рассчитанных по данным МСУ-МР в точках, где был зарегистрирован пожар
  • Для локализации пожаров на снимках МСУ-МР использовалась информация о горячих точках, детектированных по данным MODIS на территории РФ за 2021 год
  • Каждой такой точке подбирался покрывающий ее сеанс МСУ-МР. Время такого сеанса отличалось от времени регистрации точки не более, чем на 30 минут
  • Отрицательная выборка строилась по наборам сеансов МСУ-МР, покрывающих области, на которых не было зарегистрировано горячих точек MODIS в день этого сеанса

Разработка методов детектирования пожаров по данным прибора МСУ-МР

Параметр

Краткое описание

R2

Коэффициент отражения в канале 2 (700-1100 нм)

T4

Яркостная температура в канале 4 (3500-4100 нм)

T5

Яркостная температура в канале 5 (10500-11500 нм)

dT

T4 -T5

T4_mean,T5_mean, dT_mean

Средние значения фона вокруг горячей точки

T4_mad, T5_mad,

dT_mad

Абсолютное среднее отклонение фона

Bkg_fire_mad

Статистика по высокотемпературной части фона

test1…test6

Линейные комбинации вышеописанных параметров, использующиеся оригинальным MOD14

Описание параметров горячих точек выборки

5 of 11

Классификация табличных данных

  • На предложенном наборе данных была протестирована работа порядка 30 моделей классического машинного обучения
  • Целевой метрикой была взята f1-score, которая одновременно реагирует на пропуски и ложные срабатывания, при этом не учитывая величину верных негативных срабатываний моделей
  • Почти все тестируемые модели показали сопоставимый результат (>95%), при этом модель Random Forest с различными значениями параметра n_estimators показывали наивысший результат
  • Для итогового тестирования выбрана модель Random Forest с n_estimators=100 (стандартное значение)

Разработка методов детектирования пожаров по данным прибора МСУ-МР

Полученные параметры точности по контрольной выборке

Количество верных срабатываний (ВС)

12424

Пропуски (П)

640

Ложные тревоги (ЛТ)

187

Верные отсутствия горячих точек (ВО)

225736

Точность (ВС / (ВС+ЛТ))*100%

98.5

Полнота (ВС/ (ВС+ П))*100%

95.1

F1 метрика (2ВС/(2ВС+П+ЛТ))*100%

96.8

6 of 11

Разработка методов детектирования пожаров по данным прибора МСУ-МР

  • Слева: область сцены, снятой спутником МСУ-МР (04.08.2022 08:51:45). Черным выделена маска облачности; область отображена в 4 канале в диапазоне от 280 К до 327 К (от черного к белому)
  • Справа: пример работы алгоритма детектирования, основанного на методах машинного обучения, на рассматриваемой области сцены. Зеленым выделен результат работы алгоритма

Исходный результат

7 of 11

Исходный результат

Анализ работы предложенных методов детектирования горячих точек на сценах МСУ-МР за 3 и 4 августа 2022 года (независимо от собранной выборки в рабочем процессе) показал:

  • Высокий показатель полноты для алгоритма, основанном на методах машинного обучения (среднее для сцены 99.28%)
  • Низкий показатель точности для алгоритма, основанном на методах машинного обучения (среднее для сцены 50.92%)

Разработка методов детектирования пожаров по данным прибора МСУ-МР

Пример ложных детектирований в результате работы алгоритма на области сцены МСУ-МР

8 of 11

Новый способ построения обучающей выборки

  • Развитие порогового алгоритма детектирования горячих точек по МСУ-МР позволил повторно провести сбор данных, с опорой на точки, определенные как пожарные пороговым алгоритмом и дополнительно подтвержденные горячими точками с соседних сеансов других приборов (MODIS, VIIRS итд)
  • Таким образом в разы повысились достоверность и объем выборки
  • Было собрано порядка 100 тыс. примеров для положительной выборки и порядка 15 млн. для отрицательной
  • Изменения коснулись цепочки обработки, теперь на вход модели подаются только точки, проходящие первичные консервативные пороговые тесты. Данные проверки гарантийно отбрасывают только отрицательные случаи, тем самым уменьшая возможности для ложных детектирований обученной модели

Разработка методов детектирования пожаров по данным прибора МСУ-МР

9 of 11

Результат

  • Обученная на новом наборе данных модель Random Forest показывает близкие к идеальным показатели метрик качества, что делает необходимым проверку работы модели непосредственно в конечном рабочем процессе.
  • Работа модели была протестирована на всех доступных сеансах МСУ-МР за 2022 год, покрывающих территорию РФ. Полученное значение интегральной площади, пройденной пожарами, соответствует этой же величине, рассчитанной с помощью порогового алгоритма. Данный результат напрямую следует из способа формирования обучающей и тестовых выборок.

Разработка методов детектирования пожаров по данным прибора МСУ-МР

Полученные параметры точности по контрольной выборке

Количество верных срабатываний (ВС)

28661

Пропуски (П)

87

Ложные тревоги (ЛТ)

18

Верные отсутствия горячих точек (ВО)

4526431

Точность (ВС / (ВС+ЛТ))*100%

99.9

Полнота (ВС/ (ВС+ П))*100%

99.9

F1 метрика (2ВС/(2ВС+П+ЛТ))*100%

99.8

Лесная площадь пожаров

MODIS

3077908 га

MSU-MR пороговый

2444469 га

MSU-MR Random Forest

2372061 га

Сравнение интеральных оценок площадей, пройденными пожарами на территории РФ за 2022 год, полученных с помощью разных алгоритмов детектирования пожаров (оценка работы модели в рабочем процессе)

10 of 11

Валидация результатов работы пороговой модели

  • Сравнение работы Random Forest и порогового алгоритма показывает, что большая часть сеансов отрабатывается обоими алгоритмами одинаково в пределах допустимой погрешности
  • Визуальный анализ результатов детектирований двух методов на сеансах, где разница детектирования была больше 20%, показал, что на сеансах, где оба варианта детектирования фиксируют ложные срабатывания, количество таких ложных срабатываний для Random Forest всегда значимо меньше, чем для пороговой модели
  • Одним из возможных вариантов использования обученной модели является проверка работы порогового алгоритма - предлагается отдельно проверять те сеансы, на которых наблюдается значительное расхождение в результатах детектирования пожаров двумя способами

Разработка методов детектирования пожаров по данным прибора МСУ-МР

Сравнение работы алгоритмов на сеансах

Разница в количестве детектирований ГТ между Random Forest и пороговым алгоритмом (+-%)

Количество сеансов

(всего 1223)

% сеансов от общего количества

0

657

54%

<5%

952

78%

<20%

1013

83%

>20%

210

17%

11 of 11

Разработка методов детектирования пожаров по данным прибора МСУ-МР

  • Для решения задачи детектирования пожаров, как классификации табличных данных был заново собран набор данных с опорой на точки, определенные как пожарные пороговым алгоритмом и дополнительно подтвержденные горячими точками с соседних сеансов других приборов (MODIS, VIIRS итд). В результате улучшилась корреляция между выборкой и реальными данными. Протестированная на всех сценах МСУ-МР за 2022 год, покрывающих территорию РФ, обученная модель показала близкий результат с пороговым алгоритмом детектирования. При этом для данной задачи единственный способ повышения эффективности работы модели является дальнейшее уточнение обучающей выборки.
  • Изучение разницы в работе обученной модели и порогового алгоритма привело к выводу о полезности совместного использования методов для проверки получаемых результатов.

Заключение