1 of 52

MENTALIDAD Y FOCO

Definiendo los pilares

2 of 52

Los dos aspectos que vamos a trabajar

Conocimientos

  • Temática que más dominas o te gusta
  • Ciencia de Datos
  • Experiencia

30 %

70-80% del tiempo

Marca

  • Cómo te comunicas tu valor con los demás

  • Cómo te muestras
  • Cómo les ayudas
  • Cómo eres único

70 %

20-30% del tiempo

3 of 52

Tu Meta

Hacia dónde quieres llegar.

Definiendo objetivos de manera SMART

4 of 52

Los pasos para definir buenos objetivos

  • Paso 1 – qué quieres lograr a 1, 5 y 10 años vista
  • Paso 2 – definir una lista de 10 metas
  • Paso 3 – quedarte con las 3 más importantes y redefinirlas como SMART
  • Paso 4 – trazar el plan para lograrlo (en las sesiones 1 a 1 y durante la mentoría lo trabajaremos)

5 of 52

Objetivos y Objetivos SMART

“Si no sabes hacia dónde vas ningún viento es favorable”

6 of 52

“Si no sabes hacia dónde vas ningún viento es favorable”

7 of 52

Mis objetivos al principio

  • Hacia dónde queremos ir … los objetivos marcan las tareas que tienes que hacer y hacia dónde quieres ir.

Estos fueron mis objetivos cuando empecé conceptosclaros.com:

  • Compartir mis conocimientos
  • Ayudar a los demás
  • Conocer personas con mis valores para abrir puertas profesionales y encontrar sinergias
  • Aprender a escribir y comunicar mi valor
  • Dejar el trabajo: conseguir 2000€/mes limpios

8 of 52

Los objetivos de los Científicos Libres

  • Profesionalizarme en torno a los datos
  • Ofrecer mis servicios como analista o científico de datos
  • Dominar el análisis cuantitativo de los datos
  • Encontrar un proyecto dónde poder participar como profesional de los datos
  • Abrir puertas profesionales en la temática que me gusta
  • Compartir mi conocimiento
  • Conocer nuevas personas cercanas a mis valores
  • Fortalecer mi marca profesional
  • Conseguir mis primeros clientes
  • Diseñar mi marca profesional
  • Ganar experiencia con los proyectos de ciencia de datos

9 of 52

Los convertiremos a SMART

  • S - Specific (específico): ya lo has sido en el anterior paso
  • M - Measurable (medible): que sea medible. Métricas en dinero, en horas, en contactos
  • A - Attainable (alcanzable): razonable. Que veas que puedas conseguir
  • R - Relevant (relevante): importante para ti. Para tu vida.
  • T - Timely (a tiempo): ¿cuándo quieres conseguir esa meta? Pon una fecha realista

10 of 52

Los objetivos de los Científicos Libres

  • Convertimos Profesionalizarme en torno a los datos en SMART:

    • Terminar los ejercicios de la etapa 1 de Analiza tus Datos antes del día dd/mm/aa
    • Ganar experiencia en proyectos replicando los proyectos del Científico Libre antes de dd/mm/aa
    • Crear el portofilio de proyectos de datos para la fecha dd/mm/aa
    • Diseñar mi primer servicio antes de la fecha dd/mm/aa
    • Conseguir mi primer cliente beta antes de la fecha dd/mm/aa

  • Convertimos Diseñar mi marca profesional en SMART:

    • Diseñar mi perfil de LinkedIn en base a un portfolio de datos antes del día dd/mm/aa
    • Conseguir mis 100 primeros contactos interesados en mi nuevo perfil antes del día dd/mm/aa

11 of 52

Tu misión

Cómo definir la propuesta de valor paso a paso

12 of 52

Los pasos para definir la propuesta única de valor

  • Paso 1 – definir tu temática y subtemática
  • Paso 2 – encontrar tu público objetivo.
    • Colectivo
    • Necesidades
    • Problemas
  • Paso 3 – definir tu propuesta de valor basado en:
    • Informar (listado de recursos, herramientas, lista de errores, lista de problemas…)
    • Inspirar (casos de éxito, proyectos exitosos…)
    • Educar (enseñar los pasos de tu método con un ejemplo…)
    • Entretener (curiosidades del sector…)
  • Paso 4 – resumir todo en una frase:
    • YO AYUDO [PÚBLICO OBJETIVO] A [SU PROBLEMA/NECESIDAD Nº1] A CONSEGUIR [EL RESULTADO QUE LES AYUDAS A CONSEGUIR] PARA LOGRAR [EL SUEÑO MÁS PROFUNDO]

13 of 52

Temática y subtemática

Ejemplos de temáticas que necesitan profesionales de datos

14 of 52

Lista de opciones

  • Los datos están en todo los lugares y en todos los sitios.

  • Es cuestión de encontrar tu hueco en el mercado. Trataré de dibujar una lista de opciones.

  • Industria
  • Ciencias
  • Deporte
  • Negocio y empresas
  • Investigación
  • I+D
  • Instituciones públicas

15 of 52

Ejemplos de temáticas y subtemáticas

  • Juntamos datos y las áreas que has visto antes:

    • Datos + negocio + Power BI 🡪 El futuro de los datos
    • Datos + fútbol + profesión emergente 🡪 Objetivo Analista
    • Datos + Ciencia + Marca 🡪 Conceptos Claros
    • Datos + Deporte + Formación 🡪 Martí Casals
    • Datos + Política
    • Datos + Salud + Publicaciones
    • Datos + negocios online
    • Datos + calidad + satisfacción del cliente

16 of 52

Público Objetivo

A quién quieres atraer y ayudar con tu marca profesional

17 of 52

Público objetivo

PÚBLICO OBJETIVO

=

GRUPO DE PERSONAS

CON CARACTERÍSTICAS COMUNES

AL QUE VAS ATRAER EN TU PERFIL DE LINKEDIN

(y vas a informar, inspirar, enseñar, entretener)

18 of 52

Definiendo el público objetivo

CÉNTRATE EN QUÉ DUDAS TIENE Y QUÉ PERFIL TIENE

  • Define tres públicos mirando sus dudas e inquietudes y observando su profesión, estudios etc…

EJEMPLOS DE PÚBLICOS OBJETIVOS QUE IDENTIFIQUÉ EN MIS INICIOS

  • Estudiantes de matemáticas de bachillerato o la universidad para ayudarlos a aprobar los exámenes.

  • Al gran público interesado en las mates, pero que nunca las ha entendido y quiere hacerlo de una vez por todas.

  • Investigadores consagrados y doctorandos que se preocupan por la estadística para poder justificar sus hipótesis de investigación.

  • Profesionales técnicos y científicos como ingenieros, informáticos, economistas, biólogos, etc. que quieren aprender cómo analizar los datos en su trabajo.

19 of 52

Ejemplos de públicos objetivo

  • Científicos que no saben muy bien cómo trabajar sus datos
  • Project managers que requiere de profesional técnico para sus proyectos
  • Dueños de negocios que no saben cómo sacar todo el potencial de los datos
  • Jefes de departamentos en empresas privadas que necesitan contratar personal especializado en datos
  • Doctorandos que no saben cómo presentar sus proyectos de datos
  • Managers de empresas de la industria que necesitan soluciones de datos especializadas
  • Investigadores “de letras” o “ciencias” que no se le dan bien los números
  • Periodistas que quieres especializarse al periodismo de datos

20 of 52

Propuesta de Valor

Qué necesita tu público concretamente y cómo le puedes ayudar

21 of 52

¿Qué es la propuesta de valor?

  • ¿Cómo vas a ayudar a avanzar a tu público objetivo? Se trata de ponerse en su piel y tratar de:
  • Piensa en la temática y el público objetivo. Pregúntate: ¿Qué podría serle útil? ¿Qué problemas les podría solucionar? ¿Qué necesidades podría satisfacer?

    • INFORMAR: cómo está el mercado. El estado del arte
    • INSPIRAR: toca el corazón de mi público objetivo y les ayuda a ver nuevas oportunidades
    • ENSEÑAR: les hago de tutor. Les enseño los detalles y de forma natural me posiciono como un experto
    • ENTRETENER

22 of 52

Ejemplos de propuesta de valor

Problemas/Necesidades

Soluciones (ejemplo)

Dirigidos a estudiantes de doctorado: No sé cómo tratar los datos de mi tesis doctoral

  • Enseño las bases estadísticas para lograrlo
  • Inspiro con casos de mis alumnos que han conseguido sacarse la tesis sin tener ni idea de números
  • Informo sobre tipos de herramientas y enseño cuáles de ellas son las recomendables para su caso

Dirigido a científicos/técnicos: Quiero cambiar de trabajo y me siento estancado. Creo que los datos son una oportunidad

  • Enseño mi camino para lograrlo
  • Inspiro con mi historia
  • Informo de la situación del mercado actual. Que es la era de la marca personal
  • Enseño cómo crear un portfolio de proyectos capaz de generar autoridad a tu público objetivo

Dirigido a profesores: No sé cómo asesorar a mis alumnos de proyectos final de máster por culpa de la estadística

  • Enseño qué etapas son esenciales para convertirte en un científico de datos
  • Enseño cómo ser un consultor de datos o asesor de datos
  • Inspiro con casos de mis alumnos

23 of 52

La oferta irresistible

Trata de plasmar tu misión en una frase corta y memorable

24 of 52

Oferta irresistible

  • La oferta irresistible es el corazón de nuestra marca

Y ya tenemos todas las piezas para definirla

25 of 52

Oferta irresistible

  • Usaremos una fórmula:

YO AYUDO [PÚBLICO OBJETIVO] A [SU PROBLEMA/NECESIDAD Nº1] A CONSEGUIR [EL RESULTADO QUE LES AYUDAS A CONSEGUIR] PARA LOGRAR [EL SUEÑO MÁS PROFUNDO]

26 of 52

Oferta irresistible

  • Usaremos una fórmula:

YO AYUDO [PÚBLICO OBJETIVO] A [SU PROBLEMA/NECESIDAD Nº1] A CONSEGUIR [EL RESULTADO QUE LES AYUDAS A CONSEGUIR] PARA LOGRAR [EL SUEÑO MÁS PROFUNDO]

  • Mi oferta irresistible:

“Yo ayudo a científicos y técnicos estancados en su profesión a conseguir diseñar su trabajo a través de los datos para vivir la vida de forma más libre, innovadora y ayudando a los demás”

27 of 52

Tu Proyecto Core

Durante los bloques de ciencia de datos vamos a trabajar un proyecto core paso a paso con tus propios datos

28 of 52

Las características del proyecto core

  • Nuestro problema se debe poner solucionar con un clasificador
  • Necesitamos una variable respuesta cualitativa, la clase
  • Y variables explicativas que nos den información de esa clase

29 of 52

Los 7 pasos del proyecto core de un Científico de Datos

y cómo usarlo como catalizador de tu especialización como profesional de datos.

Dominando este proyecto dominarás el 90% de los proyectos prácticos en cualquier sector

30 of 52

Objetivo – problema a solucionar

  • ESCUCHA, ESCUCHA, PREGUNTA ENTIENDE EL PROBLEMA QUE QUEREMOS SOLUCIONAR
  • FILOSOFÍA DEL PROYECTO. EL FONDO DE LA CUESTIÓN

31 of 52

Objetivo – problema a solucionar

  • Queremos diagnosticar ENFERMEDAD X a partir de características del paciente
    • ¿Contexto, dónde lo vais a aplicar ?
    • ¿Con qué tipo de pacientes, con qué datos?
    • ¿Queréis conocer la importancia de esas características del paciente en el diagnóstico?

32 of 52

Los 7 pasos del proyecto Core

5. Modelar y Transformar Datos

6. Inferencia (modelos estadísticos)

7. Creación de herramientas de reconocimiento de patrones

FIN. Entrega (informe, herramienta)

1. Definición del problema

2. Definir el objetivo en cada fase

3. Leer Datos y limpieza

4. Descripción y exploración

  • FASE 1 - Descriptivo
  • FASE 2 - Inferencial (comparativo, relacional, causal)
  • FASE 3 - Reconocimiento de patrones
  • Clustering, reducción dimensional, reglas de asociación
  • Clasificación – 90% de los casos
  • Regresión

33 of 52

Aumentando complejidad

  • FASE 1 – DESCRIPTIVO - EXPLORACIÓN (se aplica siempre)
    • Tendencias, gráficos, indicios

  • FASE 2 – INFERENCIAL (normalmente se aplica cuando el proyecto requiere investigar, I+D)
    • Conclusiones estadísticas con significación (comparaciones, correlaciones, modelos)
    • Variables más importantes

  • FASE 3 – RECONOCIMIENTO DE PATRONES (se aplica cuando queremos una herramienta)
    • Segmentación, reducción dimensional
    • Clasificación (en el 90% de los casos)
    • Regresión (ingeniería, sensores, economía… cuando las variables son cuantitativas)

34 of 52

1. Planteamiento del proyecto - Estructura

  • El objetivo es poder crear una máquina predictiva capaz de diagnosticar ENFERMEDAD X con características del paciente
  • Esta herramienta se podría integrar en el diagnóstico de otras enfermedades
  • Se requiere también evaluar qué variables son las más importantes en la detección del la enfermedad X
  • Es una estrategia transversal y se puede utilizar para diagnosticar más enfermedades

ALGORITMO

VARIABLES

DE

ENTRADA

VARIABLE

DE

SALIDA

+40 características del paciente

SI ENFERMEDAD

NO ENFERMEDAD

35 of 52

2. Lectura de datos

  • Origen de datos:
    • Ficheros de texto
    • Bases de datos
    • Páginas web

VARIABLES ENTRADA

Característica paciente

SALIDA

Diagnóstico

36 of 52

3. Limpieza y preparación de datos

  • Imputar valores perdidos
  • Quitar observaciones erróneas
  • Calcular nuevas variables
  • Codificar la variable respuesta

37 of 52

4. Exploración – descripción de los datos

  • Poner la variable respuesta en el foco de la exploración
  • Calcular la correlación de las variables de entrada con la respuesta

38 of 52

4. Exploración – descripción de los datos

39 of 52

4. Exploración – descripción de los datos

40 of 52

5. Modelizado clásico – modelos estadísticos

  • Trataremos de calcular un modelo estadístico que nos permita calcular la significación de los coeficientes
  • Seleccionar la combinación de variables más interesantes

41 of 52

6. Reconocimiento de patrones

  • Clustering
  • Reducción dimensional
  • Reglas de asociación
  • Clasificación – 90% de los casos
  • Regresión

Características en sangre

ENFERMEDAD SI

ENFERMEDAD NO

42 of 52

6. Reconocimiento de patrones

Pasos de un proyecto clasificador

    • Imputar valores perdidos
    • Seleccionar variables de entrada
    • (opcional) transformar variables
    • Partir los datos en 70/30 u 80/20
    • Balanceo de los datos
    • Entrenar un listado de algoritmos / modelos
    • Seleccionar mejor modelo
    • Tunning / optimización del modelo

43 of 52

TRAINING

VARIABLES

DE

ENTRADA

VARIABLE

DE

SALIDA

DATA PARTITIONING

TRAINING DATA

Base de datos para training

80 %

RESAMPLING DATA

GENERANDO GRUPOS DE TRAINING DATA

Esto nos ayuda a mejorar el error del modelo y el overfitting

  • Crear 10 grupos de 3 repeticiones – k-fold
  • Crear 100 nuevos grupos generando la muestra a partir de la distribución de training data- bootstraping
  • Quitar una variable de entrada cada vez - LOOCV

SUBSAMPLING

BALANCEAR DATOS

Necesitamos balancear los datos ya que los grupos no son iguales en número

  • Down-sampling – quitar datos grupos datos
  • Up-sampling – ampliar los grupos pequeños
  • SMOTE – híbrido para caso binario
  • ROSE – híbrido para multiclase

44 of 52

6. Reconocimiento de patrones

45 of 52

6. Reconocimiento de patrones

46 of 52

6. Reconocimiento de patrones

47 of 52

7. Reporting – entrega de herramienta

  • Explicar muy bien el objetivo y problema a solucionar
  • El método y pasos que has seguido
  • Técnicas utilizadas (nombrarlas)
  • Mostrar los resultados. Resumir lo máximo posible
  • Conclusiones
  • Siguientes pasos
  • Cómo usar la herramienta

48 of 52

Un servicio modelable

5. Modelar y Transformar Datos

6. Inferencia (modelos estadísticos)

7. Creación de herramientas de reconocimiento de patrones

FIN. Entrega (informe, herramienta)

1. Definición del problema

2. Definir el objetivo en cada fase

3. Leer Datos y limpieza

4. Descripción y exploración

PROYECTO

DESCRIPTIVO

PROYECTO

INFERENCIAL

PROYECTO

MACHINE LEARNING

49 of 52

Take away

El resumen de la lección

50 of 52

Lo más importante de la lección

  • El 70% marca y el 30% conocimiento
  • Todo el mundo comunica. Todo el mundo tiene una marca quiera o no. Es cuestión de diseñarla conscientemente
  • Los ingredientes de un Científico Libre son:
    • Ingrediente nº1 = Pasión por una temática
    • Ingrediente nº2 = Conocimientos en un tema concreto
    • Ingrediente nº3 = Herramientas/Calculadoras
    • Ingrediente nº4 = Estadística, machine learning
    • Ingrediente nº5 = Tu marca y propósito

  • El portfolio nos ayudará a ganar experiencia rápido y ganar autoridad

51 of 52

Tu turno

Las tareas de esta semana

52 of 52

A trabajar :

  • Con lo que hemos repasado hoy … dale una segunda vuelta a las hojas de trabajo del científico libre bloque I sobre marca profesional y estrategia de portfolio marcado en amarillo en la imagen: https://analizatusdatos.com/cursos/cientifico-libre/

  • Piensa en datos y en un problema a resolver para poder llevar a cabo el proyecto core.

  • Todo esto lo vamos a repasar en la sesión 1 a 1.