Domina los conceptos del análisis
INTRODUCCIÓN AL MACHINE LEARNING Y DEEP LEARNING
ÍNDICE
2- ¿Qué es el machine learning y qué problemas soluciona en la práctica? 4
3- Los dos tipos de machine learning y los tipos de problemas con un mapa 6
Dos tipos de machine learning 6
El mapa de aplicaciones prácticas de ciencia de datos 7
4- Por qué nació el Deep Learning y qué diferencias hay con el machine learning 8
Machine learning vs Deep learning 8
5- Aplicaciones reales del Deep learning 10
Campos de aplicación de Deep learning 10
Generación automática de escritura a mano 12
Seguimos ampliando el conocimiento base.
Ahora ya conoces los modelos estadísticos, sus outputs y lo que tienes que tener en cuenta a la hora de interpretarlos. Esto esta genial y, de hecho, los modelos estadísticos son el principio del uso de técnicas de alto valor que vas a ver en la etapa 3 de ciencia de datos.
En este apartado vas a conocer qué es machine learning y en qué se diferencia de los modelos estadísticos y vas a conocer la intuición práctica del deep learning y sus diferencias con el machine learning. Primero conoceremos la foto global y ya pasaremos a la práctica en los modelos de Ciencia de Datos con la etapa 3 del programa, pero es importante situarnos antes.
A continuación, vas a descubrir:
Antes de empezar repasaremos la pirámide del análisis de datos y la complejidad de las técnicas. La base de esta pirámide es la descripción de los datos para obtener tendencias y patrones. El nivel dos es la inferencia, como puedo comparar, relacionar y aplicar modelos causales que me permitan responder a preguntas. El último escalón es el de la predición y reconocimiento de patrones, consiste en la creación de herramientas prácticas para la toma de decisiones y es donde utilizaremos técnicas de machine learning y deep learning.
Machine learning es la continuación de los modelos estadísticos
El machine learning es la continuación de los modelos estadísticos, el next step. Sin embargo, la esencia es siempre la misma.
A continuación, se muestra un ejemplo sencillo de regresión donde un modelo lineal (función matemática) relaciona una o varias variables de entrada (como la edad o incluso el sexo) con una de salida (frecuencia cardiaca máxima). Se genera un sistema de entrada y salida.
En el machine learning esta función matemática puede ser un modelo estadístico, como los que ya hemos visto, o un algoritmo. De esta manera se aumentan las posibilidades de calcular esta f(x) (esta función). El objetivo al final es encontrar una pequeña maquina matemática, ya sea un algoritmo o una función, que te permita predecir una variable de salida en función de unas entradas. El machine learning permite entrenar esa función matemática o algoritmo para después utilizarlo con nuevos datos. Su foco no está tanto en la interpretabilidad del problema, sino en la predicción o estimación de que puede pasar con datos de eventos futuros, mediante una máquina entrenada con eventos conocidos. Un modelo estadístico también tiene capacidad predictiva, pero en el machine learning a parte de modelos estadísticos también se integran los algoritmos.
Enfoque estadístico vs machine learning y Ejemplos
La diferencia principal entre el enfoque estadístico y el machine learning recae en la utilidad de cada técnica. Al final, la estadística nació para contestar preguntas a nivel estadístico y tomar decisiones en base a unas hipótesis. Eso es en lo que se ha basado siempre la estadística clásica que es realmente muy importante. La investigación y contestar preguntas con un nivel de confianza es la clave de la parte estadística. Ahora bien, también está el machine learning, que pone el foco en solucionar problemas. No se centra tanto en “saber que pasa” sino en que a partir de nuevos casos poder estimar la variable de respuesta fácilmente. Crear herramientas matemáticas que ayuden en la toma de decisiones y a indagar profundamente dentro de los datos.
Problemas que se pueden solucionar con el machine learning:
Son aplicaciones muy directas que se pueden presentar como herramientas que profundizan mucho más en los datos ayudando de diversa manera a mejorar la toma de decisiones.
Aquí conocerás los dos tipos de problemas de machine leanring y que puedes resolver con cada uno de ellos.
Por una parte, encontramos el machine learning supervisado donde se conoce la información de la variable de salida y de las variables de entrada. Siguen la misma estructura que un modelo estadístico (cálculo de los coeficientes a partir de los datos pasados a los que se tiene acceso). Hay información sobre las variables de entrada y sobre la variable de salida (que es la que me interesa predecir) a partir de la cual se entrena un algoritmo. La estructura de entrada y salida que comentábamos.
Encontramos dos tipos de machine leraning supervisado:
En el machine learning NO supervisado no tengo información de la variable de salida. Esto ocurre en:
Es fundamental entender este mapa.
El machine learning se divide en dos tipos de problemas principales: los supervisados y los no supervisados. Los problemas supervisados son aquellos en los que se cuenta con información tanto de la variable de entrada, como de la variable de salida. Hay dos tipos principales:
Es decir, depende fundamentalmente de la naturaleza de la variable de salida, la que queremos predecir. Si esta es cuantitativa estaremos ante un problema de regresión, si es cualitativa, estaremos ante un problema de clasificación.
En el machine learning no supervisado, no tenemos información de la salida. Hay varias opciones:
Si con machine learning podemos hacer prácticamente de todo, ¿Por qué nació el deep learning (aprendizaje profundo)? Y… ¿Qué diferencias existen con el machine learning?
Contestemos a esta pregunta con un ejemplo. ¿Esto es un pájaro?
Evidentemente para ti, es un pájaro. Esto es así porque lo has aprendido desde bebé y aunque no seas consciente, probablemente hayas visto muchos tipos de pájaros a lo largo de tu vida y los podrías incluso clasificar y diferenciarlo de otros animales que no son pájara. ¿Cómo? Pues probablemente identifiques al pájaro por su forma, porque tiene pico, plumas, patas, etc. Tiene una serie de patrones que tu cerebro ha identificado y que e inconscientemente utiliza para diferenciar a un pájaro de cualquier otro animal.
La idea del Deep learning es eso, que la máquina matemática sepa como extraer características, de forma inconsciente incluso, para poder clasificar. Es decir, a partir de esta imagen, esta máquina matemática va a seleccionar diferentes patrones y va a aprender que esto es un pájaro. Lo va a aprender porque tú se lo vas a decir, le vas a proporcionar muchísimas imágenes de pájaros diferentes e imágenes de cosas que no son pájaros. De esa manera, esta máquina va a indagar en las imágenes, las va a transformar en matrices de datos, en data frames, vectores, etc. A partir de ahí va a ir haciendo sucesivas extracciones de características que le van a permitir diferenciar a un pájaro de algo que no es un pájaro. Una de las principales limitaciones del Deep learning es que requiere de muchísima información de entrenamiento y solo es aplicable si esta información esta disponible.
La principal diferencia entre machine learning y Deep learning es esta, quién se encarga de la extracción de características. En el Deep learning la extracción de características, o de variables de entrada, no las hace el humano, sino que las hace la misma máquina/algoritmo matemática/o.
En el machine learning clásico, el humano calcula las características que le parecen más relevantes respecto a la variable de salida y a continuación entrena una máquina capaz de clasificar. En cambio, en el aprendizaje profundo, la extracción de características más relevantes y la clasificación se hacen de manera automática. En esta imagen se habla de la red neuronal convolucional, que es la que permite la extracción de características.
Aquí te dejo una imagen con el esquema básico de funcionamiento de estas herramientas. Partimos de un input de una imagen de un coche. La maquina empieza a extraer diferentes características de esta imagen, diferentes orientaciones, patrones de color, etc. Estos patrones se van a ir organizando en un data frame, y corresponden con las variables de entrada que van a entrenar al modelo. El algoritmo hace este feature extraction se hace de manera automática. El humano solo tiene que diseñar un poco la estructura de la red y ya ella va entrenándose y extrayendo las características más relevantes. La otra etapa es la clasificación (o regresión, dependiendo de la naturaleza de la variable de salida). En esta etapa la red utiliza las características que ha ido extrayendo para generar un clasificador capaz de identificar un coche, de algo que no es un coche. Es el mismo concepto que los modelos de clasificación y regresión del machine learning, la única diferencia es que la extracción de características la hace el algoritmo.
Como ya has podido intuir, las aplicaciones principales del Deep learning son de computer vision (imágenes). También es muy interesante para el análisis de series temporales.
Basicamente se utiliza en:
Como utiliza por ejemplo YouTube cuando grabas un video, te lo pasa a texto.
Para el diagnóstico temprano de enfermedades peligrosas.
Para detección de comportamientos y actividad fraudulenta.
Automóviles que puedan conducir y circular reconociendo su entorno de forma autónoma.
Por ejemplo, de caras, se centra en la exploración profunda de imágenes.
A partir de algo que escriba el usuario.
Lo más importante de la lección: