1 of 25

Evolução Integrada

Plataforma de Dados e Estratégias de Testes

© 2025 Thoughtworks | Restricted

2 of 25

Olá, eu sou o Samuel!

Ele/he/él

2

Engenheiro de Dados Sr�+10 anos como tecnologista

ThoughtWorker há 5 anos

Gaúcho

© 2025 Thoughtworks | Restricted

3 of 25

Olá, eu sou a Vanessa!

Ela/She/ella

3

Engenheira de Dados Sr�8 anos como tecnologista

ThoughtWorker há +3 anos

Paraense-paulistana

© 2025 Thoughtworks | Restricted

4 of 25

Entendendo o cenário

4

© 2025 Thoughtworks | Restricted

5 of 25

O caso de uso

Recomendação de conteúdo

Aplicação de recomendação de conteúdo baseado no perfil da hóspede para indicações personalizada.

"A união entre o acolhimento humano e a eficiência da tecnologia, pautado em inteligência artificial."

© 2025 Thoughtworks | Restricted

6 of 25

Desafios do projeto

Jornada inicial em dados

Orçamento enxuto e prazo curto

Dependência de fornecedores externos

ObjetivoConstruir uma plataforma para habilitar aplicações de Inteligência Artificial e Machine Learning para transformar a experiência de hospedagem.

6

© 2025 Thoughtworks | Restricted

Projeto Green Field

© 2025 Thoughtworks | Restricted

7 of 25

Pilares de Engenharia de Excelência

Arquitetura Evolutiva

Portões de qualidade (Quality gates)

Integração Contínua (CI)

Entrega Contínua (CD)

Infraestrutura como Código

Cloud First

Programação em Par

Teste Automatizado

Construir com segurança integrada

© 2025 Thoughtworks | Restricted

8 of 25

Plataforma�&

Produto de dados

© 2025 Thoughtworks | Restricted

9 of 25

Recomendação de Conteúdo

Ingestão

Armazenamento

Aplicação

Pipeline de dados�& IA

Apresentação

Fontes externas

Arquitetura de solução

Cloud�Storage

Cloud�Function

Orquestração

Cloud Composer

Dataform

Dataflow

Cloud�SQL

BigQuery

Cloud�Functions

Mobile Backend APICloud Endpoints

Aplicação interna

© 2025 Thoughtworks | Restricted

10 of 25

Diamante de Testes

Estratégia de testes

+Rápido

+Barato

+Lento

+ Caro

Tamanho Individual

Custo e Tempo

© 2023 Thoughtworks

11 of 25

O nosso Diamante de Testes

Testes de validação resultados

Testes

Unitários

Teste de consistência de dados

Teste de integridade de dados

Teste de componente

© 2023 Thoughtworks

12 of 25

Mas e os dados?

12

© 2025 Thoughtworks | Restricted

13 of 25

Ingestão de Dados

Contexto

© 2025 Thoughtworks | Restricted

14 of 25

Ingestão de Dados

Pipeline de CI

© 2025 Thoughtworks | Restricted

15 of 25

Construindo o Diamante de testes

Testes de validação resultados

Testes

Unitários

Teste de consistência de dados

Teste de integridade de dados

Teste de componente

© 2023 Thoughtworks

16 of 25

Limpeza e enriquecimento dos Dados

Armazenamento

Pipeline de dados�& IA

Cloud�Storage

Dataform

BigQuery

© 2025 Thoughtworks | Restricted

17 of 25

Limpeza e enriquecimento dos Dados

Movimentando dados com Dataform

© 2025 Thoughtworks | Restricted

18 of 25

Limpeza e enriquecimento dos Dados

Assertions com Dataform

© 2025 Thoughtworks | Restricted

19 of 25

Evoluindo o Diamante de testes

Testes de validação resultados

Testes

Unitários

Teste de consistência de dados

Teste de integridade de dados

Teste de componente

© 2023 Thoughtworks

20 of 25

Consumo e Disponibilização de Dados

Validação dos resultados

© 2025 Thoughtworks | Restricted

21 of 25

Consumo e Disponibilização de Dados

Orquestração

© 2025 Thoughtworks | Restricted

22 of 25

O caminho até aqui

APIs de Ingestão de Dados

Testes Unitários e de Componente

Criação das camadas no Data Lake

Criação das pipelines de Limpeza e Enriquecimento

Criação dos testes de consistência e Integridade

Disponibilização dos dados para Consumo

Validação dos Resultados com o cliente

Testes de validação resultados

Testes

Unitários

Teste de consistência de dados

Teste de integridade de dados

Teste de componente

© 2023 Thoughtworks

23 of 25

Aprendizados

Entregas enxutas e palpáveis para a cliente

Entregas de plataforma associadas as funcionalidades prioritárias do produto

Paramento entre: Dados + Produto + Design + QA + Infra

Time multidisciplinar e diverso

© 2025 Thoughtworks | Restricted

24 of 25

Perguntas ?

© 2022 Thoughtworks

25 of 25

Obrigada

Vanessa Anjos

Engenheira de Dados�https://www.linkedin.com/in/vanessa-p-anjos/

Samuel Locatelli

Engenheiro de Dados�https://www.linkedin.com/in/sam-locatelli/��Material apresentado

https://github.com/vpanjos/tdc_sp_25_trilha_eng_dados/

© 2022 Thoughtworks