1 of 48

Princípios de Visualização de Dados Científicos

Gabriely Rangel Pereira

Layane Menezes Azevêdo

1

IME-USP

2 of 48

Agenda

2

1

Motivação

2

Guia para Visualização de Dados

2.1

Princípio e Aplicações

2.2

Exemplo

3 of 48

Motivação

3

Repassar uma informação de forma clara

Manter o interesse do espectador

Facilitar a tomada de decisões

Melhorar o diálogo sobre a pesquisa apresentada

2

4

3

1

4 of 48

Guia para Visualização de Dados

Ten guidelines for effective data visualization in scientific publications

(Kelleher and Wagener, 2011)

4

  • O crescimento na quantidade dos dados requer um meio eficaz para comunicar a informação
  • A visualização atende 2 maiores propósitos: data analysis e data presentation, esse último será o foco desta apresentação
  • Este guia pode ser aplicado na maior parte das vezes, com algumas exceções

5 of 48

1. Crie o gráfico mais simples possível, com a informação que você quer transmitir

(não o deixe mais complicado de entender)

5

6 of 48

1. Crie o gráfico mais simples possível, com a informação que você quer transmitir

6

  • Remover redundâncias em atributos
  • Evitar o uso de gráficos 3D na visualização (embora pode ser interessante para a parte da análise)
  • Melhorar o ‘Data-ink ratio’ do gráfico (Tufte, 1983)

7 of 48

Exemplo:

7

8 of 48

1. Crie o gráfico mais simples possível, com a informação que você quer transmitir

8

  • Remover redundâncias em atributos
  • Evitar o uso de gráficos 3D na visualização (embora pode ser interessante para a parte da análise)
  • Melhorar o ‘Data-ink ratio’ do gráfico (Tufte, 1983)

9 of 48

Exemplos:

9

10 of 48

Exemplos:

10

11 of 48

Exemplo: gráfico 2D com um conjunto de dados multidimensional

11

12 of 48

1. Crie o gráfico mais simples possível, com a informação que você quer transmitir

12

  • Remover redundâncias em atributos
  • Evitar o uso de gráficos 3D na visualização (embora pode ser interessante para a parte da análise)
  • Melhorar o ‘Data-ink ratio’ do gráfico (Tufte, 1983)

‘Tinta’ usada na comunicação da informação

= ___________________________________________

‘Tinta’ usada para a impressão do gráfico

13 of 48

Exemplo:

13

14 of 48

2. Considere o tipo do objeto e atributo de codificação* usados para criar o gráfico

*objeto de codificação = ponto, linha, barra, ...

*atributo de codificação de valor = posição do ponto, cor, comprimento, ...

14

15 of 48

2. Considere o tipo do objeto e atributo de codificação usados para criar o gráfico

15

  • Comprimento e posição (2D) são melhores de ser quantitativamente percebidos
  • Espessura da linha, matiz de cor e área geram uma percepção quantitativa mais difícil (deve ser usado para mostrar comparações relativas)

Humans can quantify certain graph attributes better than others

(Cleveland e McGill, 1984)

16 of 48

Indicação:

16

17 of 48

3. Foque em visualizar padrões ou visualizar detalhes

(questão básica ao criar um gráfico)

17

18 of 48

3. Foque em visualizar padrões ou visualizar detalhes

18

  • Para representar padrões, utilizar mapas de calor e gráficos de bolha
  • Gráficos de barra ou linha apenas quando os valores individuais forem importantes

19 of 48

Exemplo: Circular treemap

19

População mundial agregado por continentes e países

20 of 48

Exemplo no Jupyter Notebook

Heatmap

20

21 of 48

4. Utilize intervalos relevantes

nos eixos

(garante a correta compreensão da magnitude)

21

22 of 48

4. Utilize intervalos relevantes nos eixos

22

  • Considerar o que é mais importante: a magnitude absoluta ou relativa dos dados
  • Avaliar se o eixo deve começar em zero ou se haverá um “perfil irregular

23 of 48

Exemplo no Jupyter Notebook

Magnitude relativa

23

24 of 48

5. Escolha cuidadosamente as proporções

(soluções para séries temporais)

24

25 of 48

5. Escolha cuidadosamente as proporções

25

  • Utilizar técnicas de transformação de dados pode ajudar a visualizar séries temporais (por ex. converter para escala logarítmica)
  • Banking to 45°” (Cleveland, 1994)

A inclinação média da reta

em um gráfico deve ser de 45°

26 of 48

Exemplo:

26

Ten guidelines for effective data visualization in scientific publications

(Kelleher and Wagener, 2011)

convertendo para escala logarítmica

27 of 48

5. Escolha cuidadosamente as proporções

27

  • Utilizar técnicas de transformação de dados pode ajudar a visualizar séries temporais (por ex. converter para escala logarítmica)
  • Banking to 45°” (Cleveland, 1994)

A inclinação média da reta

em um gráfico deve ser de 45°

28 of 48

Exemplo:

28

Multi-Scale Banking to 45 Degrees

Jeffrey Heer, Maneesh Agrawala

IEEE Trans. Visualization & Comp. Graphics (Proc. InfoVis), 12(5), 701–708, 2006

comparando o uso da tecnica “Banking to 45°

29 of 48

6. Evidencie densidades distintas em pontos sobrepostos

29

30 of 48

6. Evidencie densidades distintas em pontos sobrepostos

30

  • Mudar a visualização dos pontos de opaca para transparente
  • Usar uma função densidade de probabilidade (ex.: histograma)

Depende do tipo dos dados e parâmetro de suavização escolhido

31 of 48

Exemplo:

31

alterando a transparência dos pontos

32 of 48

Exemplo do

Bokeh

Scatter plot + densidade

32

33 of 48

7. Conecte pontos apenas em dados sequenciais

(nunca em dados categóricos/qualitativos)

33

34 of 48

7. Conecte pontos apenas em dados sequenciais

34

  • Gráficos que conectam dados não-sequenciais sugerem um comportamento linear
  • Dados não-sequenciais e categóricos/qualitativos não devem ser conectados com linhas

35 of 48

Exemplo:

35

gráfico com dados qualitativos

36 of 48

8. Agregue grandes datasets de forma coesa

(como lidar com datasets muito grandes?)

36

37 of 48

8. Agregue grandes datasets de forma coesa

37

  • Podem ser simplificados via boxplots
  • Visualização de variáveis independentes: dot plots ou linked micromap plots
  • Séries temporais: cycle plots

38 of 48

Exemplo:

38

linked micromap plots

39 of 48

Exemplo:

39

40 of 48

9. Mantenha os intervalos dos eixos similares

(como comparar corretamente variáveis distintas?)

40

41 of 48

9. Mantenha os intervalos dos eixos similares

41

  • Separar variáveis com grandes diferenças de escala em sub gráficos
  • Manter intervalos visualmente parecidos entre esses sub gráficos
  • Variáveis com escalas semelhantes podem permanecer no mesmo gráfico

42 of 48

Exemplo:

42

variáveis com grandes diferenças de escala

43 of 48

10. Selecione um esquema de cores apropriado

(baseado no tipo do dado)

43

44 of 48

10. Selecione um esquema de cores apropriado

44

  • Utilizar uma ou duas cores variando de tons claros a escuros para dados quantitativos
  • Para valores relativos à média, utilizar esquema de cores divergentes
  • Esquemas qualitativos são os utilizados para dados categóricos
  • Levar em consideração as deficiências em visão de cores

Simulador de paletas para daltônicos: https://davidmathlogic.com/colorblind/

45 of 48

Gerador de

Paleta de Cores

45

46 of 48

Bônus

46

    • O gráfico deve servir a um propósito claro
    • Integrar descrições estatísticas e verbais quando necessário

(E. Tufte, 1983)

Visualization is one of the most important components of research presentation and communication due to its ability to synthesize large amounts of data into effective graphics.

(Ware, 2000)

47 of 48

Referências

47

[Edward Tufte] The Visual Display of Quantitative Information (1983)

[Mike Pantoliano] Data Visualization Principles: Lessons from Tufte (2012)

https://moz.com/blog/data-visualization-principles-lessons-from-tufte

[Claus O. Wilke] Fundamentals of Data Visualization (2019)

Online book: https://clauswilke.com/dataviz/

[C. Kelleher | T. Wagener] Ten guidelines for effective data visualization in scientific publications (2011)

Template by ALLPPT.com

48 of 48

Obrigada!

48