1 of 81

Redes

Roberto Imbuzeiro Oliveira (IMPA)

Colóquio do IMECC/Unicamp, 2018

Rede de interação de proteínas numa levedura.

https://www.nature.com/articles/nrg1272/figures/2#f2

2 of 81

Redes = grafos

Grafos descrevem muitas coisas.

Como entender os grafos que nos interessam?

(Imagem: Barrett Lyon, Projeto OPTE, 2005)

3 of 81

Redes = grafos

Grafos descrevem muitas coisas.

Como entender os grafos que nos interessam?

(Imagem: Clay Reed, Allen Institute; Wei-Chung Lee, Harvard; Sam Ingersoll, artista)

4 of 81

Ciência de Redes

Segundo a National Academy of Sciences (EUA):

the study of network representations of physical, biological, and social phenomena leading to predictive models of these phenomena.

O estudo de representações de fenômenos físicos, biológicos e sociais por redes, levando a modelos preditivos destes fenômenos.

5 of 81

Assuntos de hoje

O que esperar da Ciência de Redes?

Quais seriam os problemas matemáticos importantes?

Minha trajetória: de modelagem descritiva a processos, algoritmos e inferência.

6 of 81

Grafos

 

7 of 81

Rede de interação de proteínas numa levedura.

https://www.nature.com/articles/nrg1272/figures/2#f2

8 of 81

9 of 81

Grafos orientados

 

10 of 81

11 of 81

Por que é útil falar de grafos?

  • Linguagem para resumir e explicar fenômenos e propriedades.

  • Sugere uma série de medidas e quantidades que podem ser estudadas.

  • Estrutura de grafo tem a ver com o que acontece com os “vértices” (predição).

12 of 81

O que é difícil? (I)

Muitos problemas naturais são

NP-difíceis. Provavelmente não

há algoritmos eficientes para

resolvê-los.

13 of 81

O que é difícil? (II)

Alguns grafos são muito grandes

e só são acessíveis

indiretamente.

14 of 81

O que é difícil? (III)

Algumas redes pequenas são “medidas” com erros.

15 of 81

Uma teoria “simples” para grafos aleatórios

16 of 81

O que veremos

Muito do que torna a teoria de grafos difícil vem dos “piores casos”, não dos típicos.

Grafos aleatórios têm comportamento mais compreensível.

Mais tarde: ligação disso com modelagem.

17 of 81

O modelo de Erdös-Rényi

18 of 81

O modelo de Erdös-Rényi

19 of 81

O modelo de Erdös-Rényi

  •  

20 of 81

Graus e números de arestas

Grau de um vértice := seu número de vizinhos.

Por que é sempre verdade que

Soma dos graus = 2 x (número de arestas)?

21 of 81

Conexidade

Grafo conexo

Grafo desconexo

22 of 81

Um teorema sobre conexidade típica

  •  

23 of 81

Um grafo típico logo antes de ficar conexo

24 of 81

A maior componente conexa

  •  

25 of 81

Comportamento típico

Coisas que poderiam ser complicadas ficam simples.

Características globais determinadas por propriedades locais.

26 of 81

Que outras coisas você conhece que são assim?

27 of 81

28 of 81

A chegada dos físicos estatísticos

29 of 81

Alguns fatos a serem explicados

Muitos grafos reais são esparsos (n grande, grau médio d constante)

Faloutsos (1999): distribuição de graus segue lei de potência.

Outros artigos: diâmetro da WWW é pequeno...

30 of 81

O que é a lei de potência

Erdös-Rényi esparso

  •  

Grafos “reais”

  •  

31 of 81

Abordagem de Física Estatística

Achar modelos “microscópicos” aleatórios que expliquem a lei de potência e outras propriedades observadas no mundo real.

  • Aglomeração (amigos de amigos tendem a ser amigos)
  • Diâmetro pequeno (seis graus de separação)
  • Ocorrência de subestruturas mais gerais.

32 of 81

O modelo de Barabási-Álbert

33 of 81

Modelo de Barabási-Álbert

  •  

34 of 81

Os ricos ficam mais ricos!

  •  

35 of 81

Reproduz a lei de potência

Erdös-Rényi esparso

  •  

Barabási-Albert

  •  

36 of 81

Ideia muito influente

Gerou muitos outros modelos

Resultados rigorosos de Bollobás, Riordan &c (outros grafos aleatórios!)

Não descreve bem boa parte do que se gostaria

37 of 81

Como anda a área ahoje

Até hoje muito esforço para modelar bem diferentes redes.

  1. Os melhor modelos são específicos a domínios
  2. Nenhum modelo é ótimo, vários são valiosos

38 of 81

Gerou a minha tese de doutorado

  •  

39 of 81

Problemas com a lei de potência

Sabe-se que os métodos de medição de Faloutsos (1999) têm viés.

On the Bias of Traceroute Sampling: or, Power-law Degree Distributions in Regular Graphs”

(Achlioptas, Clauset, Eppstein, Moore, 2008)

40 of 81

Qual o problema?

Medições de graus da Internet são feitas indiretamente via as rotas de pacotes (geodésicas).

O artigo mostra que este método reporta graus diferentes dos reais.

41 of 81

Problemas com a filosofia

“Mathematics and the Internet: A Source of Enormous Confusion and Great Potential”

(Willinger, Alderson, and Doyle - Notices of the AMS)

42 of 81

Pontos positivos

Criação de uma nova linguagem:

  • mundo pequeno;
  • centralidade;
  • livre de escala; ...

Novos exemplos para se “brincar”. Interesse na estrutura do grafo e na sua relação com o que acontece nele.

43 of 81

Rede de interação de proteínas numa levedura.

https://www.nature.com/articles/nrg1272/figures/2#f2

44 of 81

Lembre da meta da Ciência de Redes

the study of network representations of physical, biological, and social phenomena leading to predictive models of these phenomena.

Modelos são importante para nos ajudar a enxergar e descrever.

Também precisamos inferir e partir para a relação entre estrutura e funcionamento.

45 of 81

Um exemplo: o cérebro

Bullmore & Sporns, 2008

46 of 81

Minha agenda de pesquisa desde ~ 2012

  1. Entender a relação entre grafos e o desenrolar de processos sobre eles.

  • Inferir propriedades de grafos e outras estruturas discretas a partir da observação de processos relacionados a estas estruturas.

  • Entender os grafos em si (em geral aleatórios).

“Uma parte é filosófica, outra parte é mais prática.”

47 of 81

Exemplos

  1. Modelo do votante em grafos bastante gerais (Ann Probab 2013)

  • Inferência de parâmetros de grafos através de passeios aleatórios (com Anna Ben-Hamou e Yuval Peres, SODA 2018)

  • Inferência de interações entre “neurônios” a partir de processos pontuais (com Guilherme Ost) e difusões (com Guilherme Reis).

48 of 81

Um exemplo: modelo do votante

49 of 81

Modelo do votante

50 of 81

Modelo do votante

Arrival

process

(Poisson)

time

51 of 81

Modelo do votante

time

52 of 81

Modelo do votante

time

Neighbor

chosen at

random

53 of 81

Modelo do votante

time

Update

opinion

54 of 81

O tempo até o consenso

Alguma hora, todos vão concordar.

Quanto tempo isso demora?

55 of 81

Dualidade

tempo

56 of 81

Dualidade

tempo

57 of 81

Dualidade

tempo

58 of 81

Dualidade

tempo

59 of 81

Conclusão

Dualidade com passeios aleatórios coalescentes.

60 of 81

Condutância

 

S

61 of 81

Condutância grande e pequena

 

Condutância constante.

62 of 81

Um fato e um teorema

Fato

Quanto maior a condutância, mais rápido o passeio aleatório perde memória de onde começou (ergodicidade).

Teorema

Se a condutância é pequena com relação ao tempo de encontro de dois passeios, então o tempo de consenso tem uma distribuição universal.

63 of 81

Redes sociais têm boa condutância

Não têm comunidades grandes, logo têm condutância média-grande (Leskovec, Lang, Dasgupta e Mahoney).

64 of 81

Mais exemplos no quadro!

65 of 81

Conclusão: algum progresso lento aqui

  1. Entender a relação entre grafos e o desenrolar de processos sobre eles.

  • Inferir propriedades de grafos e outras estruturas discretas a partir da observação de processos relacionados a estas estruturas.

  • Entender os grafos em si (em geral aleatórios).

“Uma parte é filosófica, outra parte é mais prática.”

66 of 81

Obrigado!

http://w3.impa.br/~rimfo

67 of 81

O que é o passeio aleatório?

A cada passo, ande para um

vizinho escolhido ao acaso

com distribuição uniforme.

68 of 81

O que é o passeio aleatório?

A cada passo, ande para um

vizinho escolhido ao acaso

com distribuição uniforme.

69 of 81

O que é o passeio aleatório?

A cada passo, ande para um

vizinho escolhido ao acaso

com distribuição uniforme.

70 of 81

O que é o passeio aleatório?

A cada passo, ande para um

vizinho escolhido ao acaso

com distribuição uniforme.

71 of 81

O que é o passeio aleatório?

A cada passo, ande para um

vizinho escolhido ao acaso

com distribuição uniforme.

72 of 81

O que é o passeio aleatório?

A cada passo, ande para um

vizinho escolhido ao acaso

com distribuição uniforme.

73 of 81

Teste sua intuição

  •  

N vértices

74 of 81

Dois grafos bem diferentes

C = ciclo com n vértices

G = n vértices e

(quase) todas as arestas possíveis

75 of 81

PA “enxerga a diferença”

Muito tempo vendo amarelos, oscilação, depois muito tempo vendo pretos…

Succesão de amarelos e pretos quase equiprováveis.

76 of 81

Teorema de ergodicidade

 

77 of 81

Tempo de mistura

 

78 of 81

Diferenças de tempos de mistura

 

 

79 of 81

Tempo de mistura tem a ver com condutância

 

S

80 of 81

Mistura lenta quando condutância pequena

 

 

81 of 81

Redes sociais têm boa mistura

Não têm comunidades grandes, logo têm condutância média-grande e misturam em pouco tempo (Leskovec, Lang, Dasgupta e Mahoney).