1 of 40

¡Les damos la bienvenida!

¿Comenzamos?

2 of 40

Esta clase va a ser

grabada

3 of 40

    • Juan Pérez

Presentación

del equipo

  • Profesor/a responsable: Juan Pérez
  • Coordinador/a: Juan Pérez
  • Tutores y tutoras:

COMISIÓN N°####

4 of 40

Presentación

de estudiantes

Por encuestas de Zoom

  1. País
  2. Conocimientos previos
  3. ¿Por qué elegiste este curso?

5 of 40

Presentación

de estudiantes

Por encuestas de Zoom

Conocemos un poco más respecto a nuestros conocimientos y contexto.

6 of 40

La Transformación Digital en la Industria 4.0

Unidad 01. FUNDAMENTOS DE LA CIENCIA DE DATOS

7 of 40

Objetivos de la clase

Identificar los componentes importantes de una estrategia de Data & Analytics.

Comprender el rol de los datos en la organización desde una perspectiva de Transformación Digital y en la Industria 4.0

Facilitar la identificación de oportunidades del uso de los datos para la transformación digital y la estrategia de negocios.

�Clasificar las principales herramientas para un Científico de Datos y sus características.

8 of 40

La transformación digital es el fomento de evolución y nuevos modelos de negocio, incorporando la digitalización de archivos e incorporando lo digital a todas las áreas de negocio.

  • Harvard Business Review, 2021

9 of 40

Transformación Digital

La transformación digital es el proceso mediante el cual se realizan cambios integrales en la estrategia, modelos operativos, personas, cultura y procesos.

Problemas nuevos, exigen soluciones innovadoras 🚀

Deseamos ver mejoras dramáticas en el desempeño y cambiar las rutas para lograr el éxito.

Las amenazas para las organizaciones hoy en día son más resistentes y más robustas.

Como muestra el siguiente cuadro, existe un movimiento constante

en el top de empresas líderes…

10 of 40

Ciclo de vida de un

proyecto de Ciencia de Datos

11 of 40

Ciclo de vida de un proyecto

de Ciencia de datos

Momento 1: Definir el objetivo

Momento 2: Recolección de la data

Momento 3: Preparar la data

Momento 4: Elección del Algoritmo

12 of 40

Ciclo de vida de un proyecto

de Ciencia de datos

Momento 5: Entrenar el modelo

Momento 6: Validación del modelo

Momento 7: Deployment del modelo

13 of 40

¿Qué conceptos han escuchado antes?

Por encuestas de Zoom:

  • Exploratory Data Analysis
  • Data Wrangling
  • Minería de datos
  • Limpieza de datos

  • SQL
  • Estadística inferencial
  • Machine Learning
  • Deep Learning
  • Inteligencia artificial

14 of 40

Ejemplo en vivo

¡Vamos a trabajar con datos! Miremos en los recursos complementarios “Unidad_1.ipynb” cómo crear un gráfico igual a este.

15 of 40

Aprendizaje supervisado y no supervisado

16 of 40

Supervisado

Son manzanas

es una manzana

input data

Anotaciones

?

Predicción

No supervisado

input data

17 of 40

Para pensar

Supongamos que una empresa lanza una campaña de marketing para encontrar los diferentes segmentos para un nuevo producto.

¿Que tipo de aprendizaje deberíamos utilizar en este caso? ¿Por qué?

Contesta en el chat de Zoom

18 of 40

Optimizando el stock para una PYME

Duración: 10 minutos

Ayudamos a optimizar el stock de nuestra heladería de barrio

19 of 40

ACTIVIDAD EN CLASE

Optimizando el stock para una PYME

Consigna: En la heladería de Pedro se lleva mucho tiempo trabajando sin ningún tipo de estrategia enfocada al uso de los datos como oportunidad de mejora y manejo de stocks.

Recientemente, debido a la crisis sanitaria, el dueño ha cambiado su perspectiva y piensa que su empresa debería hacer un mejor uso de los datos históricos recolectados.

  • ¿Cómo piensan que esta información puede ayudar a tener un mejor control del stock de la heladería?
  • ¿Qué nivel de madurez tendría esta empresa según el modelo Data Management Maturity Model?

20 of 40

Bases de Datos

21 of 40

Ejemplo de consulta SQL

SELECT p.FirstName, p.LastName, a.City, cd.Detail

FROM Person p

JOIN ContactDetail cd ON cd.PersonId = p.Id

JOIN ContactDetailType cdt ON cdt.Id = cd.TypeId

JOIN Address a ON a.PersonId = p.Id

22 of 40

Ejemplo de consulta no SQL

{

“Id”: “1”,

“firstName”: “Thomas”,

“lastName”: “Andersen”,

“addresses”: [

{

“line1”: “100 Some Street”,

“line2”: “Unit 1”,

“city”: “Seattle”,

“state”: “WA”,

“zip”: “98012”

}

],

“contactDetails”: [

{“email”: “thomas@anderson.com”},

{“phone”: “*1 555 555-5555”, “extension”: 5555},

]

}

23 of 40

Ejemplo en vivo

De los recursos complementarios utilizaremos el archivo “ventas_tienda”.

Realizaremos una consulta SQL en vivo para extraer información sobre los empleados de la tabla empleados.

Tiempo: 15 min

24 of 40

Para pensar

¿Qué casos de implementación en la industria conoces o has escuchado hablar, tanto de SQL como de NoSQL en empresas?

Escribe en el chat de Zoom

25 of 40

Break

¡10 minutos y volvemos!

26 of 40

Visualización de

datos

27 of 40

Herramientas de visualización de datos

Dash

Power BI

Pentaho

Shiny

Tableau

28 of 40

Ejemplos reales

29 of 40

Ejemplos reales

30 of 40

Ejemplo

31 of 40

Ejemplo en vivo

Vamos a ver cómo crear una cuenta en Github y el paso a paso para subir allí información.

Duración: 5 minutos

32 of 40

Sistemas

in-house

33 of 40

Ventajas y desventajas In-House

Ventajas

Desventajas

Seguridad. Manejo de datos sensibles sin terceros

Requiere de grandes inversiones iniciales para infraestructura y hardware

Sin tantos gastos fijos (pago a terceros por servicio)

Gastos variables por consumo y espacio además de mantenimiento

Posibilidad de autogestión dentro de la compañía.

Tiene una carga máxima (capacidad de procesamiento)

No requiere de conexión a Internet (no es limitante velocidad de conexión)

Requiere de personal capacitado para resolver problemas

Hay control sobre la infraestructura (control de acuerdo a las necesidades)

Pierde flexibilidad (acceso remoto) además de ser susceptible a perdida de datos (daños estructura)

Fuente: Kharb L. et al. (2018. A Comprehensive Study of Security in Cloud Computing)

34 of 40

Cloud

Computing

35 of 40

“El Cloud Computing, permite la aceleración y gestión de procesos computacionales, haciéndolos más eficientes”

  • Observatorio Nacional de Telecomunicaciones y de la SI

36 of 40

¡Atención!

Recuerda instalar Python con Anaconda para la próxima clase.

37 of 40

¿Preguntas?

38 of 40

Resumen

de la clase hoy

  • Cuarta Revolución Industrial
  • El Ambiente de la Industria 4.0
  • Transformación Digital
  • Ciclo de vida de un proyecto de ciencia de datos
  • Bases de Datos Relacionales y No Relacionales
  • Lenguajes de Data Science
  • Visualización de Datos
  • Herramientas Complementarias.

39 of 40

Muchas gracias.

40 of 40

Educación digital

para el mundo real.