1 of 44

Πρόβλεψη Εξάπλωσης Δασικής Πυρκαγιάς�με�Βαθιά Μηχανική Μάθηση

Διπλωματική Εργασία :

Νικόλαος Αναστασίου

National Technical University of Athens

School of Rural, Surveying and Geoinformatics Engineering

Επιβλέπων :

Ιωάννης Παπουτσής

2 of 44

Ενότητες

Dataset

DataCube, Διορθώσεις, Τροποποιήσεις, Statistics

Μοντέλα Μηχανικής Μάθησης

Training και Evaluation, UNet2D, UNet3D, Vision Transformer

Αποτελέσματα

Metrics, Visualization, Explainable AI

Εισαγωγή

Στόχος, Δεδομένα, Μεθοδολογία, Βιβλιογραφία

3 of 44

Ενότητες

Εισαγωγή

Στόχος, Δεδομένα, Μεθοδολογία, Βιβλιογραφία

Dataset

DataCube, Διορθώσεις, Τροποποιήσεις, Statistics

Μοντέλα Μηχανικής Μάθησης

Training και Evaluation, UNet2D, UNet3D, Vision Transformer

Αποτελέσματα

Metrics, Visualization, Explainable AI

4 of 44

Εισαγωγή�Στόχος της εργασίας

Στόχος είναι η πρόβλεψη της τελικής καμένης έκτασης που μπορεί να προκύψει από μια δασική πυρκαγιά, δεδομένου ενός σημείου εκκίνησης, και τηλεπισκοπηκών δεδομένων.

Διπλωματική Εργασία | Νικόλας Αναστασίου

github.com/nikos230/WildFireSpread

5 of 44

Εισαγωγή�Γιατί να δημιουργηθεί ένα τέτοιο μοντέλο ?

Κατεύθυνση πυρκαγιάς

(Βορειά, Νοτιά, etc.)

Εκτίμηση μεγέθους πυρκαγιάς

(>500ha ?, > 3500ha ?)

Συλλογή δεδομένων για το πως εξαπλώνονται οι πυρκαγιές

(Ποιες μεταβλητές και μέρες είναι σημαντικές ?)

github.com/nikos230/WildFireSpread

Διπλωματική Εργασία | Νικόλας Αναστασίου

6 of 44

Εισαγωγή�Βιβλιογραφία: CNN-BiLSTM: A Novel Deep Learning Model for Near-Real-Time Daily Wildfire Spread Prediction

Το CNN-BiLSTM μοντέλο είναι ένας συνδυασμός Convolutional Neural Networks (CNN) και Bidirectional Long Short Term Memory Networks (BiLSTM) με στόχο την εξαγωγή features για την πρόβλεψη εξάπλωσης των δασικών πυρκαγιών από μεταβλητές όπως η τοπογραφία του εδάφους, χρήσης γης, θερμοκρασία, υγρασία, ταχύτητα/κατεύθυνση ανέμου, βροχόπτωση, κτλ. Για τα σημεία εκκίνησης των πυρκαγιών χρησιμοποιήθηκαν δεδομένα από τον δορυφόρο VIIRS έτσι το μοντέλο θα μπορεί να χρησιμοποιηθεί σε πραγματικό χρόνο, αφού τα δεδομένα VIIRS έχουν μεγάλη συχνότητα. Τα δεδομένα ήταν σε μορφή patches και κάθε πυρκαγιά σχηματίζονταν από 4 patch αντί για 1. Έτσι αντί η τελική καμένη έκταση να περιέχεται σε μια μόνο «εικόνα» περιεχόταν σε 4 «εικόνες», αυτό ήταν απαραίτητο καθώς το αρχικό σχήμα των δεδομένων ήταν πολύ μεγάλο.

Συνεισφορές :

Τα Deep Learning μοντέλα και οι περιβαλλοντικές μεταβλητές μπορούν να οδηγήσουν σε μια εντελώς data-driven μέθοδο μοντελοποιήσης των δασικών πυρκαγιών
Το μοντέλο CNN-BiLSTM είχε την καλύτερη απόδοση μεταξύ των CNN και LSTM
Βρέθηκε ότι η υγρασία του εδάφους έχει σημαντική βαρύτητα στην εξάπλωση των πυρκαγιών.

github.com/nikos230/WildFireSpread

Διπλωματική Εργασία | Νικόλας Αναστασίου

7 of 44

Εισαγωγή�Βιβλιογραφία: FireCast: Leveraging Deep Learning to Predict Wildfire Spread

Το FireCast είναι ένα απλό CNN μοντέλο με 2 Convolutional Layers και 2 Blocks και ένα dense layer. Το μοντέλο έχει εκπαιδευτεί με στόχο να προβλέπει την περίμετρο της πυρκαγιάς την επόμενη μέρα, δίνοντας σαν input την τωρινή περίμετρο της πυρκαγιάς και τις μετεωρολογικές προβλέψεις της επομένης μέρας.

Συνεισφορές :

Τα απλά CNN μπορούν να εκπαιδευτούν με μετεωρολογικά δεδομένα και να δώσουν καλά αποτελέσματα ως προς την πρόβλεψη εξάπλωσης των πυρκαγιών για την επόμενη μέρα
Δεν υπάρχουν αρκετά δεδομένα (δηλαδή datasets) για αυτού του είδους τα προβλήματα (2019)

github.com/nikos230/WildFireSpread

Διπλωματική Εργασία | Νικόλας Αναστασίου

8 of 44

Εισαγωγή�Βιβλιογραφία: Next Day Wildfire Spread: A Machine Learning Dataset to Predict Wildfire Spreading From�Remote-Sensing Data

Το dataset «Next Day Wildfire Spread» παρουσιάζει ένα μεγάλο dataset με πολλές μεταβλητές σε χωρική ανάλυση 1 km x 1 km και περιέχει καθημερινά δεδομένα για την εξέλιξη της εξάπλωσης των πυρκαγιών, συνολικά περιέχει 18000 πυρκαγιές. Με αυτό το dataset εκπαιδευτήκαν ένα CNN μοντέλο και τα μοντέλα Random Forest, Logistic Regression από τα οποία το CNN είχε την καλύτερη απόδοση. Τα samples που χρησιμοποιήθηκαν είχαν μέγεθος 64 x 64 pixel, ενώ τα δεδομένα αντλήθηκαν από το Google Earth Engine. Συνολικά το μοντέλο εκπαιδευτικέ σε 11 μεταβλητές. Το μοντέλο εκπαιδευτικέ με στόχο την πρόβλεψη εξάπλωσης μιας πυρκαγιάς οπού είναι ενεργή την χρονική στιγμή t, πως θα εξαπλωθεί την χρονική στιγμή t+1.

Συνεισφορές:

Το μοντέλο CNN είχε πολύ καλύτερη απόδοση από τα μοντέλα Random Forest και Logistic Regression.
Το dataset περιέχει αρκετά δεδομένα τα οποία όλα συνεισφέρουν στην εκπαίδευση του μοντέλου με στόχο την πρόβλεψη εξαπλώσεις δασικών πυρκαγιών.

github.com/nikos230/WildFireSpread

Διπλωματική Εργασία | Νικόλας Αναστασίου

9 of 44

Εισαγωγή�Τι θέλουμε να πέτυχουμε

64 km

Variables

Temperature,

Wind Speed,

Wind Direction,

NDVI,

Humidity,�etc…

Ignition Point

Prediction

Predicted Burned Area

64 km

Deep Learning Model

github.com/nikos230/WildFireSpread

Διπλωματική Εργασία | Νικόλας Αναστασίου

10 of 44

Εισαγωγή�Μέθοδος

64 pixel

27 Variables

Supervised

Learning

Label (Burned Area)

Prediction

Inputs

Meteorological Variables

Max Temperature
U Component of Wind
V Component of Wind
Max Dewpoint Temperature
Max Surface Pressure
Min Relative Humidity
Total Precipitation
Mean Surface Solar Radiation
Day Land Surface Temperature
Night Land Surface Temperature

Vegetation Maps

Vegetation Index (NDVI)
Leaf Area Index (LAI)
Soil moisture

Land Cover

Fraction of Agriculture
Fraction of Forest
Fraction of Grassland
Fraction of Settlements
Fraction of Shrubland
Fraction of Sparse Vegetation
Fraction of Water Bodies
Fraction of Wetland

Surface Features

Elevation
Slope
Aspect
Curvature

Ignition Points / Labels

Burned Areas (Label)
Ignition Points

Deep Learning Model

64 pixel

github.com/nikos230/WildFireSpread

Διπλωματική Εργασία | Νικόλας Αναστασίου

11 of 44

Εισαγωγή�Συνεισφορές της Διπλωματικής Εργασίας

Ένα Machine Learning ready dataset για μοντελοποίηση της εξάπλωσης των δασικών πυρκαγιών στην μεσόγειο, αποτελούμενο από 28 μεταβλητές με δεδομένα από το 2006 έως το 2022.

Η μοντελοποίηση της εξάπλωσης μπορεί να γίνει με εντελώς data-driven μέθοδο.

Τρία Deep Learning μοντέλα για πρόβλεψη εξάπλωσης δασικών πυρκαγιών από δεδομένα τηλεπισκόπηκα - χρονοσειράς.

Τα μοντέλα αποδίδουν καλυτέρα όταν έχουν μετεωρολογικές προβλέψεις για τις επόμενες μέρες από την ημέρα έναρξη της πυρκαγιάς.

Η βλάστηση, η θερμοκρασία εδάφους και ταχύτητα/κατεύθυνση ανέμου είναι οι μεταβλητές που επηρεάζουν περισσότερο την εξάπλωση μιας δασικής πυρκαγιάς.

github.com/nikos230/WildFireSpread

Διπλωματική Εργασία | Νικόλας Αναστασίου

12 of 44

Ενότητες

Dataset

DataCube, Διορθώσεις, Τροποποιήσεις, Statistics

Εισαγωγή

Στόχος, Δεδομένα, Μεθοδολογία, Βιβλιογραφία

Μοντέλα Μηχανικής Μάθησης

Training και Evaluation, UNet2D, UNet3D, Vision Transformer

Αποτελέσματα

Metrics, Visualization, Explainable AI

13 of 44

Dataset�Χαρακτηριστικά Dataset | Samples (Fire Events)

27 Variables per Day�15 Dynamic & 12 Static

Spatial Resolution�1 pixel = 1 x 1 km

Temporal Resolution�1 Day

Variables Patch Size�64 x 64 km

64 x 64 pixel

Sample (Fire Event)

5 days before fire

5 days after fire (forecast)

Day 0

Day 1

Day 2

Day 3

Day 4

Day 5

Day 6

Day 7

Day 8

Day 9

Label�(Burned Area)

github.com/nikos230/WildFireSpread

Διπλωματική Εργασία | Νικόλας Αναστασίου

14 of 44

Dataset�Χαρακτηριστικά Dataset | Μεταβλητές

Meteorological Variables

Max Temperature
U Component of Wind
V Component of Wind
Max Dewpoint Temperature
Max Surface Pressure
Min Relative Humidity
Total Precipitation
Mean Surface Solar Radiation
Day Land Surface Temperature
Night Land Surface Temperature

Vegetation Maps

Vegetation Index (NDVI)
Leaf Area Index (LAI)
Soil moisture

Land Cover

Fraction of Agriculture
Fraction of Forest
Fraction of Grassland
Fraction of Settlements
Fraction of Shrubland
Fraction of Sparse Vegetation
Fraction of Water Bodies
Fraction of Wetland

Surface Features

Elevation
Slope
Aspect
Curvature

Ignition Points / Labels

Burned Areas (Label)
Ignition Points

Dynamic Variables

Static Variables

github.com/nikos230/WildFireSpread

Διπλωματική Εργασία | Νικόλας Αναστασίου

15 of 44

Dataset�Δημιουργία dataset | Patch Extraction

Mesogeos DataCube

Δεδομένα σε μορφή raster με διαστάσεις

(y, x, time)=(1752 km, 4741 km, 6026 days)

Τελικά samples (fire events) ≈ 9500

github.com/nikos230/WildFireSpread

Διπλωματική Εργασία | Νικόλας Αναστασίου

Sample σε μορφή netCDF� Περιέχει :

260 μεταβλητές (26 * 10)
Καμένη έκταση (label)

Επιλογή ενός (τυχαίου) ignition point και δημιουργία ενός παραθύρου 64 x 64 pixel με κέντρο αυτό το σημείο

Offset του παραθύρου κατά (y, x) κατά μερικά pixel, έτσι ώστε η καμένη έκταση να μην είναι στο κέντρο του παραθύρου

Extract του παραθύρου για 10 time steps, 5 μέρες πριν και 5 μετά την μέρα έναρξης της πυρκαγιάς

16 of 44

Dataset�Δημιουργία dataset | Patch Extraction

64 pixel

Random

offset

64 pixel

27 variables�10 time steps

github.com/nikos230/WildFireSpread

Διπλωματική Εργασία | Νικόλας Αναστασίου

Mesogeos DataCube

Sample

17 of 44

Dataset�Στατιστικά | Αριθμός Πυρκαγιών ανά μέγεθος πυρκαγιάς

Το μεγεθών των πυρκαγιών κατηγοριοποιήθηκε με μη-επιβλεπομένη ταξινόμηση χρησιμοποιώντας τον αλγόριθμο k-means

Οι περισσότερες πυρκαγιές έχουν μέγεθος από 250 έως 1500 εκτάρια

Η άμεσος επόμενη κατηγορία, 1500 έως 3000 εκτάρια, έχει περίπου τον μισό αριθμό πυρκαγιών από την πρώτη κατηγορία

Όσο αυξάνεται το μέγεθος των πυρκαγιών τόσο μειώνετε ο αριθμός τους στην κατηγορία αυτή

Τα παραπάνω αποτελούν imbalance για το dataset καθώς θα έπρεπε να υπάρχει ο ίδιος αριθμός πυρκαγιών σε όλες τις κατηγορίες

github.com/nikos230/WildFireSpread

Διπλωματική Εργασία | Νικόλας Αναστασίου

18 of 44

Dataset�Στατιστικά | Αριθμός πυρκαγιών (samples) ανά μήνα για όλες τις χρονιές

Το διάγραμμα, δεξιά, παρουσιάζει τον αριθμό των πυρκαγιών ανά μήνα για τις 16 χρονιές του dataset.

Οι περισσότερες πυρκαγιές προέρχονται από τους μήνες Ιούλιο και Αύγουστο, ενώ οι λιγότερες από χειμερινούς μήνες

Επίσης αρκετές πυρκαγιές προέρχονται από τον Μάρτιο και Σεπτέμβριο

Το μοντέλο θα εκπαιδευτεί με δεδομένα κύριος από θερινούς μήνες

github.com/nikos230/WildFireSpread

Διπλωματική Εργασία | Νικόλας Αναστασίου

19 of 44

Dataset�Στατιστικά | Αριθμός πυρκαγιών (samples) ανά χρονιά

Το διάγραμμα, δεξιά, παρουσιάζει τον αριθμό των πυρκαγιών ανά χρονιά για τις 16 χρονιές του dataset

Μετά το έτος 2017, με εξαίρεση το 2018, ο αριθμός των πυρκαγιών ανά έτος είναι σταθερά πάνω από 650

Πριν το 2017 ο μέσος αριθμός πυρκαγιών ανά χρονιά είναι 400 με εξαίρεση τις χρονιές 2007 και 2011

github.com/nikos230/WildFireSpread

Διπλωματική Εργασία | Νικόλας Αναστασίου

20 of 44

Ενότητες

Μοντέλα Μηχανικής Μάθησης

Training και Evaluation, UNet2D, UNet3D, Vision Transformer

Dataset

DataCube, Διορθώσεις, Τροποποιήσεις, Statistics

Εισαγωγή

Στόχος, Δεδομένα, Μεθοδολογία, Βιβλιογραφία

Αποτελέσματα

Metrics, Visualization, Explainable AI

21 of 44

Μοντέλα Μηχανικής Μάθησης�Deep Learning Models | U-Net2D, U-Net3d and Vision Transformer (ViT)

UNet2D �Baseline

UNet2D �10-day

UNet3D �10-day

Trained with

Data from

Igntion day only

26 Variables + Label

Data from

5 days before ignition day and 5 days after

Trained with

Data from

5 days before ignition day and 5 days after

Trained with

Vision Transformer �10-day

Data from

5 days before ignition day and 5 days after

Trained with

152 Variables + Label

260 Variables* + Label

152 Variables + Label

*Το U-Net3D δέχεται time steps, η κάθε μέρα έχει 26 μεταβλητές (14 δυναμικές και 12 στατικές), αρά 26 * 10 = 260 μεταβλητές��Στα μοντέλα U-Net2D και Vision Transformer τα στατικά δεδομένα περιλαμβάνονται μόνο μια φορά άρα συνολικά είναι 14 * 10 = 140 μεταβλητές + 12 στατικές = 152 μεταβλητές

github.com/nikos230/WildFireSpread

Διπλωματική Εργασία | Νικόλας Αναστασίου

22 of 44

Μοντέλα Μηχανικής Μάθησης�Διάφορες αναμεσά στα U-Net2D και U-Net3D

UNet2D

Convolution

UNet3D

Convolution

Το U-Net2D δημιουργεί τα feature maps αξιοποιώντας δεδομένα μόνο ένα time step μιας μεταβλητής

Το U-Net3D δημιουργεί τα feature maps αξιοποιώντας δεδομένα από περισσότερα time steps, συνήθως ένα time step πριν και ένα μετά

Έτσι π.χ για την ταχύτητα του ανέμου το feature map που θα δημιουργήσει το U-Net2D θα έχει δεδομένα μόνο από την μέρα 4 ενώ το U-Net3D μπορεί να δημιουργήσει το feature map αξιοποιώντας δεδομένα και από την μέρα 3 και την μέρα 5 ταυτόχρονα. Με αυτή την μέθοδο αξιοποιείται καλύτερη η χρονική πληροφορία που περιέχει το dataset

github.com/nikos230/WildFireSpread

Διπλωματική Εργασία | Νικόλας Αναστασίου

23 of 44

Μοντέλα Μηχανικής Μάθησης�Dataset Split | Training set | Validation set | Test set

Samples (Fire Events)

Years 2006 - 2022

9568 samples

7619 samples

841 samples

Training�Years 2006 - 2020

1101 samples

Validation�Year 2021

Test�Year 2022

github.com/nikos230/WildFireSpread

Διπλωματική Εργασία | Νικόλας Αναστασίου

24 of 44

Μοντέλα Μηχανικής Μάθησης�Model Architecture U-Net2D & U-Net3D

Encoder

MaxPool

Bottleneck

UpConv

Decoder

ConvFinal

Input Channels

Conv

BatchNorm

GELU

ConvBlock

Conv

BatchNorm

GELU

Conv

BatchNorm

GELU

Dropout

ConvTranspose

ConvBlock

Conv

Concat

ConvBlock

Το Activation Function που χρησιμοποιήθηκε είναι η συνάρτηση GELU (Gaussian Error Linear Units)

Το “Conv” συμβολίζει την διαδικασία του Convolution

Μετά από κάθε διαδικασία Conv γίνετε κανονικοποίηση του batch

Επιπλέον έχει προστεθεί ένα Dropout Layer για την αποφυγή του overfitting

κανονικοποίηση

�

github.com/nikos230/WildFireSpread

Διπλωματική Εργασία | Νικόλας Αναστασίου

25 of 44

Μοντέλα Μηχανικής Μάθησης�Model Architecture U-Net2D & U-Net3D

Encoder

MaxPool

Bottleneck

UpConv

Decoder

ConvFinal

Input Channels

ConvBlock

ConvTranspose

ConvBlock

Conv

Concat

κανονικοποίηση

�

152 channels

Binary Segmentation Map

Value 1 = Burned Pixels�Value 0 = Un-burned Pixels

64 pixel (km)

github.com/nikos230/WildFireSpread

Διπλωματική Εργασία | Νικόλας Αναστασίου

26 of 44

Μοντέλα Μηχανικής Μάθησης�U-Net2D, U-Net3D & Vision Transformer Training Processes (Supervised Learning)

Model

Sample_1

Sample_2

etc…

Feedfoward

Prediction

Loss

Function

Loss = (some number)

Backpropagetion

Weights, Bias

Batch

Loss Calculation

Label

Για Loss function χρησιμοποιήθηκε ο συνδυασμός από 2 Loss functions. Το πρώτο είναι το BCE Loss και το δεύτερο είναι το Dice Loss. Από τον συνδυασμό προέκυψε το BCEDice Loss

Model

Update

Repeat

yi είναι το πραγματικό label για το i-th pixel (0 ή 1)
y_hat_i είναι η πιθανότητα που το μοντέλο πρόβλεψε να ανήκει σε μια ομάδα για το i-th pixel
N είναι ο αριθμός των pixel της εικόνας
|A∩B| είναι η επικάλυψη της μάσκας που πρόβλεψε το μοντέλο A και της πραγματικής μάκας B

github.com/nikos230/WildFireSpread

Διπλωματική Εργασία | Νικόλας Αναστασίου

27 of 44

Μοντέλα Μηχανικής Μάθησης�Training, Validation Loss Plots

Για όλα τα μοντέλα U-Net2D και U-Net3D χρησιμοποιήθηκε αρχικό Learning Rate = 0.001 και LR Scheduler που ανά 3 εποχές χωρίς μείωση του Validation Loss μειώνει το LR από 0.001 σε 0.0001 κτλ.

Για το Vision Transformer χρησιμοποιήθηκε αρχικό Learning Rate = 0.0001 με LR Scheduler που ομοίως μειώνει το LR όταν δε παρατηρείται μείωσή του Validation Loss

Σε όλα τα διάγραμμα παρατηρείται η επίδραση του LR Scheduler καθώς στις τελευταίες εποχές η γραμμή του Train loss είναι σχεδόν παράλληλη με του Validation Loss αντί να παρατηρείται αύξηση του Train Loss (Overfitting)

github.com/nikos230/WildFireSpread

Διπλωματική Εργασία | Νικόλας Αναστασίου

28 of 44

Ενότητες

Μοντέλα Μηχανικής Μάθησης

Training και Evaluation, UNet2D, UNet3D, Vision Transformer

Dataset

DataCube, Διορθώσεις, Τροποποιήσεις, Statistics

Εισαγωγή

Στόχος, Δεδομένα, Μεθοδολογία, Βιβλιογραφία

Αποτελέσματα

Metrics, Visualization, Explainable AI

29 of 44

Αποτελέσματα�Metrics

Για την επιλογή του καλυτέρου μοντέλου κατά την διάρκεια της εκπαίδευσης και της τελικής αξιολόγησης χρησιμοποιήθηκε το F1 Score / Dice Score που για 2D Binary Segmentation υπολογίζονται με τον ίδιο μαθηματικό τύπο

Το Dice Score είναι μια ένδειξη κατά πόσο 2 σχήματα είναι όμοια, όπως είναι το σχήμα της πρόβλεψης του μοντέλου και το Label

Ακόμη, το Recall πρέπει να είναι αρκετά μεγάλο καθώς το μοντέλο πρέπει να προβλέπει σωστά τα πραγματικά καμένα pixel, για να μην γίνετε underestimate του μεγέθους της πυρκαγιάς

github.com/nikos230/WildFireSpread

Διπλωματική Εργασία | Νικόλας Αναστασίου

30 of 44

Αποτελέσματα�Overall Models Performance – Test Set (1101 samples)

Metrics (%)	UNet2D Baseline (1-day)	UNet2D 10-day	UNet3D 10-day	Vision Transformer 10-day
Dice / F1 Score	48.3	51.7	53.6	43.7
IoU	31.9	34.8	36.6	28.0
Precision	50.2	58.6	59.6	59.4
Recall	46.6	46.2	48.8	34.6

Το U-Net3D 10-day μοντέλο έχει 5.3% μεγαλύτερο F1-Score από το baseline μοντέλο και 1.9% μεγαλύτερο F1-Score από το αντίστοιχο U-Net2D 10-day μοντέλο. Αυτό σημαίνει ότι η επιπλέον χρονική πληροφορία ενισχύει την απόδοση του μοντέλου. Επιπλέον ο τρόπος επεξεργασίας των δεδομένων (time series) από τα 3D Convolutions έναντί των 2D Convolutions φαίνεται να είναι καλύτερος, όπως φαίνεται από την απόδοση του U-Net3D 10-day έναντι του U-Net2D 10-day, τα 2 αυτά μοντέλα έχουν εκπαιδευτεί στα ιδιά δεδομένα.

Η πολύ χαμηλή απόδοση του Vision Transformer ενδεχόμενος οφείλετε στο ότι το μοντέλο δεν ήταν προ-εκπαιδευμένο και ότι οι αρχιτεκτονικές τύπου transformer χρειάζονται πολύ μεγάλο όγκο δεδομένων για την εκπαίδευση τους.

github.com/nikos230/WildFireSpread

Διπλωματική Εργασία | Νικόλας Αναστασίου

31 of 44

Αποτελέσματα�Test per Fire Cluster

Για κάθε κατηγορία μεγέθους πυρκαγιάς έγινε ξεχωριστά test στο μοντέλο.

Από την πρώτη έως και την τρίτη κατηγορία με πυρκαγιές ως 5000 εκτάρια παρατηρείται σταθερή επίδοση, ενώ στην τέταρτη κατηγορία με πυρκαγιές έως 8500 εκτάρια παρατηρείται μείωση 2.6%

Από την τρίτη κατηγορία και έπειτα η μείωσή απόδοσης του μοντέλου είναι μεγάλη, κυρίως στις τελευταίες κατηγορίες που το μεγεθών των πυρκαγιών αυξάνετε πάρα πολύ

Μέγεθος Πυρκαγιάς
250 1500	1500 3000	3000 5000	5000 8500	8500 14000	14000 20000	20000 35000	> 35000
Αριθμός sample (πυρκαγιών) ανά κατηγορία στο test set
451	298	161	107	40	22	18	4

github.com/nikos230/WildFireSpread

Διπλωματική Εργασία | Νικόλας Αναστασίου

32 of 44

Binary to Shape

Αποτελέσματα�Visualization | Μετατροπή των Binary Mask σε Shapefiles

Αφινικός Μετασχηματισμός

Ground Truth

Shapefile

Prediction

Shapefile

Add Metadata

Burned Area ha�Country

Year�Fire Date�Dice Score�Sample Name

Predicted Mask�(Predicted Burned Area)

Ground Truth Mask�(Actual Burned Area)

github.com/nikos230/WildFireSpread

Διπλωματική Εργασία | Νικόλας Αναστασίου

33 of 44

Αποτελέσματα�Visualization Maps

34 of 44

Αποτελέσματα�Visualization Maps

35 of 44

Αποτελέσματα�Visualization Maps

36 of 44

Αποτελέσματα�Visualization Maps

37 of 44

Αποτελέσματα�Visualization Maps

38 of 44

Αποτελέσματα�Visualization Maps

39 of 44

Αποτελέσματα�Visualization Maps

40 of 44

Αποτελέσματα�Explainable AI (xAI) | Permutation method

Inputs

Trained Model

Output

F1 Score (%)

Variable 1

Variable 2

Variable 3

Variable 4

etc.

Normal Evaluation

Baseline

Score (%)

Step 1

Inputs

Trained Model

Output

F1 Score (%)

Variable 1

Variable 2

Variable 3

Variable 4

etc.

Permutation

Score (%)

Step 2

Step 3

Importance of�Variable 1

Baseline

Score (%)

Permutation

Score (%)

Zero all values

Step 4

Un-zero Variable 1

Για κάθε sample στο test set περνάει από το μοντέλο και υπολογίζεται το f1 score του, π.χ 80%, έπειτα μηδενίζεται η πρώτη μεταβλητή, π.χ η ταχύτητα ανέμου, και το sample περνάει ξανά στο μοντέλο και υπολογίζεται το νέο f1 score. Από την αφαίρεση των δυο f1 score προκύπτει το importance της μηδενισμένης μεταβλητής

Continue from step 2, zero next Variable

github.com/nikos230/WildFireSpread

Διπλωματική Εργασία | Νικόλας Αναστασίου

41 of 44

Αποτελέσματα�xAI | Βαρύτητα Ημέρων

Το διάγραμμα, δεξιά, έχει προκύψει μηδενίζοντας τις μεταβλητές κάθε μέρας ξεχωριστά και υπολογίζοντας το f1 score και αφαιρώντας το από το baseline score που είναι το sample χωρίς καμία μεταβλητή – μέρα μηδενισμένη.

Όσο μεγαλύτερη τιμή έχει το “Importance” στον άξονα Y τόσο μειώνεται το f1 score του μοντέλου όταν μηδενίζονται οι μεταβλητές για εκείνη την μέρα.

Από το διάγραμμα προκύπτει ότι οι μέρες πριν την έναρξη της πυρκαγιάς (μέρες 0 έως 3) δεν έχουν καμία σημαντική επίδραση στην απόδοση του μοντέλου

Αντίθετα οι μέρες μετά την πυρκαγιά (μέρες 5 έως 9) φαίνεται να έχουν την μεγαλύτερη επιρροή, πράγμα που είναι αναμενόμενο καθώς οι μετεωρολογικές μεταβλητές έχουν σημαντικό ρολό στην τελική καμένη έκταση.

Τέλος την μεγαλύτερη βαρύτητα έχει η μέρα 4 η οποία είναι και η μέρα εκκίνησης της πυρκαγιάς

github.com/nikos230/WildFireSpread

Διπλωματική Εργασία | Νικόλας Αναστασίου

42 of 44

Αποτελέσματα�xAI | Βαρύτητα Μεταβλητών

Το διάγραμμα, δεξιά, έχει προκύψει μηδενίζοντας τις μεταβλητές (για όλες τις μέρες) ξεχωριστά

Οι μεταβλητές που περιέχουν παρόμοια πληροφορία όπως οι Leaf Area Index και Normalized Difference Vegetation Index μηδενίζονται ταυτόχρονα καθώς αν μηδενιστή η μια το μοντέλο θα χρησιμοποίηση πληροφορία από την άλλη. Η ιδιά μέθοδος χρησιμοποιήθηκε και στις μεταβλητές U-component of Wind και V-component of Wind.

Όπως παρατηρήθηκε οι μεταβλητές που έχουν πληροφορία για την βλάστηση έχουν το μεγαλύτερο “Importance” και έπειτα οι μεταβλητές που σχετίζονται με την θερμοκρασία του εδάφους. Στη συνέχεια βρίσκονται οι μετεωρολογικές μεταβλητές

*Εκτός του Ignition Points

github.com/nikos230/WildFireSpread

Διπλωματική Εργασία | Νικόλας Αναστασίου

43 of 44

Αποτελέσματα�Land Cover

44 of 44

Ενότητες

Μοντέλα Μηχανικής Μάθησης

Training και Evaluation, UNet2D, UNet3D, Vision Transformer

Dataset

DataCube, Διορθώσεις, Τροποποιήσεις, Statistics

Εισαγωγή

Στόχος, Δεδομένα, Μεθοδολογία, Βιβλιογραφία

Αποτελέσματα

Metrics, Visualization, Explainable AI

Ευχαριστώ πολύ για την προσοχή σας!