Disciplina de Ciência de Dados
Apresentação da Disciplina: Ciência de Dados
Explorando o Ecossistema, Papéis Profissionais, Ciclo de Vida e Aplicações Reais no Mundo Contemporâneo.
Transformando Dados em Inteligência
Profa. Semíramis Assis
2026
O que é Ciência de Dados?
A Ciência de Dados é um campo interdisciplinar que combina métodos científicos, processos, algoritmos e sistemas para extrair conhecimento e insights de dados estruturados e não estruturados.
O objetivo principal é transformar dados brutos em decisões estratégicas que gerem valor real para as organizações, unindo tecnologia e visão analítica.
Os Três Pilares
Matemática e Estatística
Ciência da Computação
Conhecimento de Domínio
O Ecossistema de Ciência de Dados
O ecossistema é vasto e composto por diversas linguagens e bibliotecas que facilitam a manipulação e análise de grandes volumes de informação. Python e R lideram a preferência dos profissionais devido à sua flexibilidade e comunidade ativa.
Categoria
Ferramentas e Bibliotecas
Linguagens
Python, R, SQL, Julia
Manipulação de Dados
Pandas, NumPy, Dask
Visualização
Matplotlib, Seaborn, Plotly, Tableau
Machine Learning
Scikit-learn, TensorFlow, PyTorch
Infraestrutura e Plataformas
Para suportar o processamento de dados em larga escala, a Ciência de Dados utiliza infraestruturas robustas, muitas vezes baseadas em nuvem.
Cloud Computing
AWS (Amazon Web Services)
Google Cloud Platform (GCP)
Microsoft Azure
Tecnologias de Big Data
Essenciais para lidar com volumes massivos de dados, garantindo escalabilidade e velocidade no processamento.
Apache Spark
Hadoop Ecosystem
Os 3 V's do Big Data:
Volume
Velocidade
Variedade
Papéis Profissionais na Área de Dados
A área de dados possui papéis distintos que colaboram entre si para transformar dados em inteligência. Cada profissional possui um foco específico, desde a infraestrutura até a análise preditiva e a colocação de modelos em produção.
Papel
Foco Principal
Ferramentas Comuns
Analista de Dados
Insights históricos, criação de dashboards e relatórios de Business Intelligence (BI).
SQL, Power BI, Tableau, Excel
Cientista de Dados
Modelagem preditiva, experimentação estatística e desenvolvimento de algoritmos de IA.
Python, R, Scikit-learn, Estatística
Engenheiro de Dados
Construção de pipelines, arquitetura de bancos de dados e garantia da qualidade dos dados.
Spark, Airflow, SQL, NoSQL
Engenheiro de ML
Implantação de modelos em produção (MLOps), monitoramento e escalabilidade.
Docker, Kubernetes, MLflow, CI/CD
Ciclo de Vida dos Dados: Parte 1
O ciclo de vida dos dados é o processo pelo qual a informação passa desde sua criação até sua transformação em valor. As fases iniciais focam na fundação e qualidade dos dados.
01
Geração e Coleta
Identificação e captura de dados de diversas fontes, como sensores IoT, logs de servidores, redes sociais e bancos de dados transacionais.
02
Ingestão e Armazenamento
Movimentação dos dados coletados para repositórios centralizados, como Data Lakes ou Data Warehouses, garantindo segurança e acessibilidade.
03
Processamento e Limpeza
Aplicação de processos ETL para tratar valores ausentes, remover duplicatas e normalizar os dados para análise.
Ciclo de Vida dos Dados: Da Análise à Decisão
04
Análise e Modelagem
Exploração estatística profunda e treinamento de modelos de Machine Learning para identificar padrões e tendências ocultas nos dados.
05
Visualização e Comunicação
Tradução de resultados técnicos complexos em visualizações intuitivas e narrativas de dados que orientam a tomada de decisão executiva.
06
Implantação e Monitoramento
Colocação do modelo em ambiente de produção real e acompanhamento contínuo de sua performance para garantir precisão ao longo do tempo.
O ciclo de vida é iterativo: os resultados do monitoramento frequentemente levam a novas coletas ou refinamentos nos modelos.
Aplicações Reais de Ciência de Dados
Finanças
Detecção de fraudes em tempo real em transações e modelos para análise de risco de crédito.
Saúde
Diagnóstico precoce de doenças por IA e desenvolvimento de medicina personalizada.
Varejo e E-commerce
Recomendações personalizadas e previsão de demanda para otimizar estoques.
Marketing
Segmentação de clientes para campanhas direcionadas e análise de sentimento em redes sociais.
Ética, Privacidade e o Futuro
Ética e Privacidade
A conformidade com a LGPD e o uso ético de algoritmos tornaram-se pilares inegociáveis. A transparência no uso de dados é a base da confiança do cliente.
LGPD COMPLIANCE
IA Generativa
O avanço dos LLMs está transformando a Ciência de Dados, permitindo análises automatizadas e a criação de interfaces de dados mais humanas e intuitivas.
Democratização
O futuro aponta para o "Self-service BI", onde ferramentas de baixo código permitem que profissionais de todas as áreas extraiam valor dos dados.
"A tecnologia avança, mas a responsabilidade humana sobre os dados permanece como o centro de toda inovação."
Conclusão
Impacto Estratégico
A Ciência de Dados não é mais um diferencial competitivo, mas uma necessidade fundamental para a sobrevivência e inovação das organizações modernas.
Visão de Futuro
A integração entre IA Generativa, ética rigorosa e democratização do acesso aos dados moldará a próxima década de descobertas.
"Dados são o novo petróleo, mas a Ciência de Dados é a refinaria que os torna úteis."
Provérbio da Era Digital