GT Malware DataLab
Diego Kreutz
Rodrigo Mansilha
Angelo Nogueira
Hendrio Bragança
Luiz Laviola
Kayuã Paim
2
Por que projetos de IA falham?
Top 10 Reasons Why AI Projects Fail
1. Applying application development
approaches to data-centric AI
3. Lack of sufficient quantity of data
4. Lack of sufficient quality of data
6. Misalignment of real world data
85% dos projetos de IA falham
3
Contexto e Motivação
ML, AutoML, XAI e AML na Detecção de Malwares Android: desafios e lições
4
Contexto e Motivação
Dataset | Ano | Tipo Carac. | Amostras | Cars. | % M / B |
Adroit | 2016 | P | 11476 | 166 | 29.8 / 70.2 |
Androcrawl | 2013 | P, I, CAPI | 96732 | 141 | 10.5 / 89.5 |
Android_Per | 2021 | P | 26864 | 151 | 66.21 / 33.79 |
DefenseDroid | 2021 | P, I | 11975 | 2938 | 50.1 / 49.9 |
Drebin-215 | 2012/ 2018 | P, CAPI, CS, I | 15036 | 215 | 37 / 63 |
KronoDroid | 2021 | P, CS | 78137 | 383 | 53 / 47 |
MH-100K | 2023 | P, CAPI, I | 101934 | 268 | 9.61 / 91.39 |
Exemplos de datasets utilizados para treinar modelos para detectar malwares Android
5
Contexto e Motivação
Dataset | Ano | Tipo Carac. | Amostras | Cars. | % M / B |
Adroit | 2016 | P | 11476 | 166 | 29.8 / 70.2 |
Androcrawl | 2013 | P, I, CAPI | 96732 | 141 | 10.5 / 89.5 |
Android_Per | 2021 | P | 26864 | 151 | 66.21 / 33.79 |
DefenseDroid | 2021 | P, I | 11975 | 2938 | 50.1 / 49.9 |
Drebin-215 | 2012/ 2018 | P, CAPI, CS, I | 15036 | 215 | 37 / 63 |
KronoDroid | 2021 | P, CS | 78137 | 383 | 53 / 47 |
MH-100K | 2023 | P, CAPI, I | 101934 | 268 | 9.61 / 91.39 |
Datasets defasados (amostras e rotulagem defasadas)
6
Contexto e Motivação
Dataset | Ano | Tipo Carac. | Amostras | Cars. | % M / B |
Adroit | 2016 | P | 11476 | 166 | 29.8 / 70.2 |
Androcrawl | 2013 | P, I, CAPI | 96732 | 141 | 10.5 / 89.5 |
Android_Per | 2021 | P | 26864 | 151 | 66.21 / 33.79 |
DefenseDroid | 2021 | P, I | 11975 | 2938 | 50.1 / 49.9 |
Drebin-215 | 2012/ 2018 | P, CAPI, CS, I | 15036 | 215 | 37 / 63 |
KronoDroid | 2021 | P, CS | 78137 | 383 | 53 / 47 |
MH-100K | 2023 | P, CAPI, I | 101934 | 268 | 9.61 / 91.39 |
Quantidades e tipos limitados de características e amostras
7
Contexto e Motivação
Dataset | Ano | Tipo Carac. | Amostras | Cars. | % M / B |
Adroit | 2016 | P | 11476 | 166 | 29.8 / 70.2 |
Androcrawl | 2013 | P, I, CAPI | 96732 | 141 | 10.5 / 89.5 |
Android_Per | 2021 | P | 26864 | 151 | 66.21 / 33.79 |
DefenseDroid | 2021 | P, I | 11975 | 2938 | 50.1 / 49.9 |
Drebin-215 | 2012/ 2018 | P, CAPI, CS, I | 15036 | 215 | 37 / 63 |
KronoDroid | 2021 | P, CS | 78137 | 383 | 53 / 47 |
MH-100K | 2023 | P, CAPI, I | 101934 | 268 | 9.61 / 91.39 |
Desbalanceamento de classes
8
Como obter datasets atualizados e representativos?
Datasets atualizados?!
9
Construção de Datasets
ADBuilder
AMGenerator e AMExplorer
10
ADBuilder
11
VirusTotal permite apenas 250 rotulações por dia
200 dias para rotular 50K amostras
ADBuilder
12
Podemos utilizar datasets atualizados menores e IA generativa para aumentar datasets e também detectar malwares mutantes?
Datasets: usar IA generativa?
13
Data Augmentation
Utilizada em diversos domínios:
14
Por que aumentar os dados?
Data Augmentation
15
Onde se encaixa o data augmentation dentro do pipeline de ML?
Data Augmentation
16
Pipeline de IA para detecção de malwares
E1: Construção de datasets (e.g., ADBuilder, AMGenerator)
17
E2: utilizar Redes Neurais Artificiais para aumentar e variar datasets (e.g., DroidAugmentor)
Pipeline de IA para detecção de malwares
18
E3: pipeline convencional de ML, incluindo treinamento dos classificadores
Pipeline de IA para detecção de malwares
19
E4: utilização dos classificadores para detecção de malwares
Pipeline de IA para detecção de malwares
20
E2: AutoDroid + DroidAugmentor para compreender e viabilizar a utilização de Redes Neurais Artificiais para aumentar e variar datasets
Desafios:
Pipeline de IA para detecção de malwares
AutoDroid
DroidAugmentor
Serviço Proposto
21
Objetivos
Oferecer um serviço para reduzir a curva de aprendizado e facilitar a investigação de técnicas avançadas de geração de dados sintéticos para expandir datasets úteis na classificação de aplicativos Android (benigno ou maligno).
O1. Ambiente de Execução (extensão inovadora)
O2. Ambiente de Avaliação (pesquisa)
O3. Material de Aprendizado e Treinamento (ensino)
22
Malware DataLab: visão geral
Malware DataLab: laboratório de ensino, aprendizagem e experimentação com AutoDroid e DroidAugmentor
23
Malware DataLab: interface
24
Malware DataLab: exemplos de saídas
Matriz de confusão para cada dobra (fold)
25
Curvas de aprendizagem (perdas do gerador e discriminador)
Malware DataLab: exemplos de saídas
26
Avaliação de aplicabilidade através de gráficos de métricas de classificação
Malware DataLab: exemplos de saídas
27
Avaliação de similaridade através de métricas e mapas de calor
Malware DataLab: exemplos de saídas
28
Cronograma
3 meses de evolução da DroidAugmentor
Marco 1: nova versão
29
Cronograma
6 meses de desenvolvimento do serviço e integração
Marco 2: disponibilização do serviço (uso interno)
30
Cronograma
3 meses de testes, melhoramentos e evolução
Marco 3: disponibilização do serviço (uso externo)
31
Cronograma
3 meses de utilização e acompanhamento
Marco 4: disponibilização de material de aprendizado
Diego Kreutz
Rodrigo Brandão Mansilha
rodrigomansilha@unipampa.edu.br
Luiz Felipe Laviola Leite
luizlaviola.aluno@unipampa.edu.br
Kayuã Oleques Paim
Angelo Gaspar Diniz Nogueira
Hendrio Luis de Souza Bragança
32
Equipe & Contato
GT Malware DataLab
Obrigado!
Alegrete, 19/01/2023
34
Malware DataLab: arquitetura
35
AutoDroid: arquitetura
Execução parametrizada e escalável da DroidAugmentor
AutoDroid
36
AutoDroid: arquitetura
DroidAugmentor: execução e geração de saídas para o usuário
37
DroidAugmentor: pipeline
Dados das amostras e parâmetros de execução (e.g., otimizador, coeficientes, número de épocas, número de camadas, número de neurônios por camada, função de perda)
38
Dataset real é utilizado para treinar a cGAN
DroidAugmentor: pipeline
39
Ruído aleatório e rótulo desejado para gerar o dataset sintético
DroidAugmentor: pipeline
40
O dataset real é usado para treinar o classificador
DroidAugmentor: pipeline
41
Avaliação de similaridade: comparar amostras sintéticas e reais
DroidAugmentor: pipeline
42
Avaliação de aplicabilidade através de classificadores
DroidAugmentor: pipeline
43
Saídas da ferramenta
DroidAugmentor: pipeline
GT Malware DataLab
Obrigado!
Alegrete, 19/01/2023