1 of 47

Utilizando aprendizado por representação para a classificação de laços sociais da IoT

Jamisson J. Junior¹

Thiago S. Figueiredo¹

Ramon Lopes²

Luiz C. B. Torres¹

Bruno P. Santos¹

¹Universidade Federal de Ouro Preto

²Universidade Federal do Recôncavo da Bahia

CoUrb

2 of 47

INTRODUÇÃO

  • A Internet das coisas (IoT) envolve a interconexão entre objetos do cotidiano;
  • A Internet das Coisas Sociais (SIoT): relação social entre dispositivos

CoUrb

3 of 47

INTRODUÇÃO

  • Para Marche et al. (2018) existem ao menos 4 tipos de relacionamentos sociais;

CoUrb

4 of 47

INTRODUÇÃO

  • Para Marche et al. (2018) existem ao menos 4 tipos de relacionamentos sociais;

Mesmas características físicas

CoUrb

5 of 47

INTRODUÇÃO

  • Para Marche et al. (2018) existem ao menos 4 tipos de relacionamentos sociais;

Mesmo proprietário

CoUrb

6 of 47

INTRODUÇÃO

  • Para Marche et al. (2018) existem ao menos 4 tipos de relacionamentos sociais;

Mesma região

CoUrb

7 of 47

INTRODUÇÃO

  • Para Marche et al. (2018) existem ao menos 4 tipos de relacionamentos sociais;

Encontros frequentes

CoUrb

8 of 47

INTRODUÇÃO

  • Para Marche et al. (2018) existem ao menos 4 tipos de relacionamentos sociais;

Variações

CoUrb

9 of 47

INTRODUÇÃO

Criar definições

1

Projetar modelos de classificação

2

CoUrb

10 of 47

INTRODUÇÃO

Criar definições

1

Projetar modelos de classificação

2

CoUrb

11 of 47

INTRODUÇÃO - APRENDIZADO DE REPRESENTAÇÃO

Figura 1 - Graph Embedding utilizando Representation Learning (Fonte: snap.stanford.edu/proj/embeddings-www)

Entrada Saída

CoUrb

12 of 47

METODOLOGIA - FLUXO DE EXECUÇÃO

CoUrb

13 of 47

METODOLOGIA - FLUXO DE EXECUÇÃO

Construção da rede siot

CoUrb

14 of 47

METODOLOGIA - REDE SIoT

CoUrb

15 of 47

METODOLOGIA - FLUXO DE EXECUÇÃO

Método de representação indutiva

CoUrb

16 of 47

METODOLOGIA - GNN

CoUrb

17 of 47

METODOLOGIA - GNN

CoUrb

18 of 47

METODOLOGIA - GNN

CoUrb

19 of 47

METODOLOGIA - GNN

Framework GraphSAGE

CoUrb

20 of 47

METODOLOGIA - FLUXO DE EXECUÇÃO

Método de representação transdutivo

CoUrb

21 of 47

METODOLOGIA - ALGORITMOS TRADICIONAIS DE CLASSIFICAÇÃO (ATC)

CoUrb

22 of 47

METODOLOGIA - ALGORITMOS TRADICIONAIS DE CLASSIFICAÇÃO (ATC)

CoUrb

23 of 47

METODOLOGIA - ALGORITMOS TRADICIONAIS DE CLASSIFICAÇÃO (ATC)

CoUrb

24 of 47

METODOLOGIA - ALGORITMOS TRADICIONAIS DE CLASSIFICAÇÃO (ATC)

Framework Node2vec

Support Vector Machine (SVM)

Random Forest (RF)

Logistic Regression (LR)

CoUrb

25 of 47

METODOLOGIA - FLUXO DE EXECUÇÃO

Figura 1. Fluxo de execução.

CoUrb

26 of 47

METODOLOGIA - FLUXO DE EXECUÇÃO

  • Seja:
    • C o conjunto de tipos de laços sociais;
    • G = (V, E, r)
      • |V| de vértices
      • |E| arestas;
      • r : E → C
  • precisamos aprender uma função de aproximação de r

CoUrb

27 of 47

EXPERIMENTOS

É possível classificar os tipos de laços sociais em SIoT?

1

Como a escolha da abordagem afeta o desempenho?

2

CoUrb

28 of 47

EXPERIMENTOS - BASE DE DADOS

  • 16.216 dispositivos IoT reais e sintéticos dispostos na cidade de Santander;
    • Móveis ou estáticos;
    • Usuários privados ou públicos
  • A base de dados pode ser acessada em social-iot.org

CoUrb

29 of 47

EXPERIMENTOS - BASE DE DADOS

  • A base de dados foi dividida aleatoriamente em:
    • 70% para treino;
    • 20% validação;
    • 10% teste

CoUrb

30 of 47

EXPERIMENTOS - BASE DE DADOS

  • A base de dados foi dividida aleatoriamente em:
    • 70% para treino;
    • 20% validação;
    • 10% teste

CoUrb

31 of 47

EXPERIMENTOS - BASE DE DADOS

  • A base de dados foi dividida aleatoriamente em:
    • 70% para treino;
    • 20% validação;
    • 10% teste

CoUrb

32 of 47

EXPERIMENTOS - METODOLOGIA DE AVALIAÇÃO

  • F1 score: definida como a média harmônica entre precision e recall;
  • Devido ao desbalanceamento, escolhemos:
    • Macro: calcula a métrica F1 para cada classe separadamente, então, calcula a média aritmética entre esses valores;
    • Micro: calcula a métrica de forma global.

CoUrb

33 of 47

EXPERIMENTOS - CLASSIFICADORES E HIPERPARÂMETROS

GNN

ATC

  • Grid search foi utilizado para a tunagem dos parâmetros

Parâmetro

Valores

Dimensão

8, 16, 32, 64

Profundidade da rede

0, 1, 2

Função de decaimento

1e−5, 1e−4, 1e−3, 1e − 2

Taxa de aprendizagem

1e−5, 1e−4, 1e−3, 1e − 2

Parâmetro

Valores

Dimensão

8, 16, 32, 64

Largura e a profundidade da caminhada

0.5, 1, 2

Walk length

80

Number of walks

10

CoUrb

34 of 47

EXPERIMENTOS - CLASSIFICADORES E HIPERPARÂMETROS

GNN

ATC

  • Grid search foi utilizado para a tunagem dos parâmetros

Parâmetro

Valores

Dimensão

8, 16, 32, 64

Largura e a profundidade da caminhada

0.5, 1, 2

Walk length

80

Number of walks

10

Parâmetro

Valores

Dimensão

8, 16, 32, 64

Profundidade da rede

0, 1, 2

Função de decaimento

1e−5, 1e−4, 1e−3, 1e − 2

Taxa de aprendizagem

1e−5, 1e−4, 1e−3, 1e − 2

CoUrb

35 of 47

EXPERIMENTOS - CLASSIFICADORES E HIPERPARÂMETROS

GNN

ATC

  • Grid search foi utilizado para a tunagem dos parâmetros

Parâmetro

Valores

Dimensão

8, 16, 32, 64

Largura e a profundidade da caminhada

0.5, 1, 2

Walk length

80

Number of walks

10

Parâmetro

Valores

Dimensão

8, 16, 32, 64

Profundidade da rede

0, 1, 2

Função de decaimento

1e−5, 1e−4, 1e−3, 1e − 2

Taxa de aprendizagem

1e−5, 1e−4, 1e−3, 1e − 2

CoUrb

36 of 47

RESULTADOS - MELHOR DESEMPENHOS DE CADA MODELO

CoUrb

37 of 47

RESULTADOS - É POSSÍVEL CLASSIFICAR OS LAÇOS SOCIAIS EM SIoT ?

LR e RAN são pouco eficientes para identificar os padrões presentes dentro da SIoT;

CoUrb

38 of 47

RESULTADOS - COMO A ESCOLHA DOS MODELOS AFETAM OS RESULTADOS?

RF e SVM obtiveram melhor desempenho sobre as métricas;

CoUrb

39 of 47

RESULTADOS - COMO A ESCOLHA DOS MODELOS AFETAM OS RESULTADOS?

GNN não foi e capaz de classificar corretamente instâncias das três classes menos representativas;

CoUrb

40 of 47

RESULTADOS - COMO A ESCOLHA DOS MODELOS AFETAM OS RESULTADOS?

GNN realizou o treinamento e a classificação em menor tempo

CoUrb

41 of 47

RESULTADOS - COMO A ESCOLHA DOS MODELOS AFETAM OS RESULTADOS?

CoUrb

42 of 47

RESULTADOS - COMO A ESCOLHA DOS MODELOS AFETAM OS RESULTADOS?

RF tem melhores resultados em baixas dimensões;

CoUrb

43 of 47

RESULTADOS - COMO A ESCOLHA DOS MODELOS AFETAM OS RESULTADOS?

SVM obteve melhores resultados em altas dimensões;

CoUrb

44 of 47

RESULTADOS - COMO A ESCOLHA DOS MODELOS AFETAM OS RESULTADOS?

GNN mantém constância para alterações bruscas da dimensão;

CoUrb

45 of 47

CONCLUSÕES

É possível criar modelos para classificar os tipos de laços sociais;

SVM apresentou o melhor desempenho sobre as métricas;

GNN executou em menor tempo;

1

2

3

CoUrb

46 of 47

AGRADECIMENTOS

CoUrb

47 of 47

MUITO OBRIGADO

Jamisson Jader M. P. Junior

jamisson.junior@aluno.ufop.edu.br

CoUrb