Ahora ya conoces los modelos estadísticos, sus outputs y lo que tienes que tener en cuenta a la hora de interpretarlos. Esto esta genial y, de hecho, los modelos estadísticos son el principio del uso de técnicas de alto valor que vas a ver en la etapa 3 de ciencia de datos.

En este apartado vas a conocer qué es machine learning y en qué se diferencia de los modelos estadísticos y vas a conocer la intuición práctica del deep learning y sus diferencias con el machine learning. Primero conoceremos la foto global y ya pasaremos a la práctica en los modelos de Ciencia de Datos con la etapa 3 del programa, pero es importante situarnos antes.

A continuación, vas a descubrir:

Qué es machine learning y qué problemas soluciona en la práctica
Los dos tipos de machine learning y sus aplicaciones con un mapa
Por qué nació el Deep learning y qué diferencias hay con el machine learning
Aplicaciones del Deep learning

Antes de empezar repasaremos la pirámide del análisis de datos y la complejidad de las técnicas. La base de esta pirámide es la descripción de los datos para obtener tendencias y patrones. El nivel dos es la inferencia, como puedo comparar, relacionar y aplicar modelos causales que me permitan responder a preguntas. El último escalón es el de la predición y reconocimiento de patrones, consiste en la creación de herramientas prácticas para la toma de decisiones y es donde utilizaremos técnicas de machine learning y deep learning.

Diagrama

Descripción generada automáticamente

2- ¿Qué es el machine learning y qué problemas soluciona en la práctica?

Machine learning es la continuación de los modelos estadísticos

El machine learning es la continuación de los modelos estadísticos, el next step. Sin embargo, la esencia es siempre la misma.

A continuación, se muestra un ejemplo sencillo de regresión donde un modelo lineal (función matemática) relaciona una o varias variables de entrada (como la edad o incluso el sexo) con una de salida (frecuencia cardiaca máxima). Se genera un sistema de entrada y salida.

Gráfico, Gráfico de dispersión

Descripción generada automáticamente Diagrama

Descripción generada automáticamente

En el machine learning esta función matemática puede ser un modelo estadístico, como los que ya hemos visto, o un algoritmo. De esta manera se aumentan las posibilidades de calcular esta f(x) (esta función). El objetivo al final es encontrar una pequeña maquina matemática, ya sea un algoritmo o una función, que te permita predecir una variable de salida en función de unas entradas. El machine learning permite entrenar esa función matemática o algoritmo para después utilizarlo con nuevos datos. Su foco no está tanto en la interpretabilidad del problema, sino en la predicción o estimación de que puede pasar con datos de eventos futuros, mediante una máquina entrenada con eventos conocidos. Un modelo estadístico también tiene capacidad predictiva, pero en el machine learning a parte de modelos estadísticos también se integran los algoritmos.

Enfoque estadístico vs machine learning y Ejemplos

La diferencia principal entre el enfoque estadístico y el machine learning recae en la utilidad de cada técnica. Al final, la estadística nació para contestar preguntas a nivel estadístico y tomar decisiones en base a unas hipótesis. Eso es en lo que se ha basado siempre la estadística clásica que es realmente muy importante. La investigación y contestar preguntas con un nivel de confianza es la clave de la parte estadística. Ahora bien, también está el machine learning, que pone el foco en solucionar problemas. No se centra tanto en “saber que pasa” sino en que a partir de nuevos casos poder estimar la variable de respuesta fácilmente. Crear herramientas matemáticas que ayuden en la toma de decisiones y a indagar profundamente dentro de los datos.

El foco estadístico es la interpretabilidad. La investigación y contestar preguntas con un nivel de confianza mediante los datos.
El machine learning quiere solucionar problemas creando herramientas que permitan predecir nuevos casos, crear grupos similares, etc.

Problemas que se pueden solucionar con el machine learning:

A partir del análisis de sangre saber si tienes o no una determinada enfermedad.
Conocer los tipos de clientes según sus características de interés.
Estimar el consumo eléctrico en los próximos días
Identificar situaciones de stress mediante un sensor tipo pulsera
Estimar el nivel de afección en la vegetación con el vuelo de un dron
Conocer los patrones de compra de los clientes de un supermercado
Estimar si un jugador se puede volver a lesionar o no
A partir de una imagen interno del cuerpo saber el tipo de cáncer
…

Son aplicaciones muy directas que se pueden presentar como herramientas que profundizan mucho más en los datos ayudando de diversa manera a mejorar la toma de decisiones.

3- Los dos tipos de machine learning y los tipos de problemas con un mapa

Aquí conocerás los dos tipos de problemas de machine leanring y que puedes resolver con cada uno de ellos.

Dos tipos de machine learning

Por una parte, encontramos el machine learning supervisado donde se conoce la información de la variable de salida y de las variables de entrada. Siguen la misma estructura que un modelo estadístico (cálculo de los coeficientes a partir de los datos pasados a los que se tiene acceso). Hay información sobre las variables de entrada y sobre la variable de salida (que es la que me interesa predecir) a partir de la cual se entrena un algoritmo. La estructura de entrada y salida que comentábamos.

Encontramos dos tipos de machine leraning supervisado:

Regresión: variable de salida cuantitativa
Clasificación: variable de salida cualitativa

En el machine learning NO supervisado no tengo información de la variable de salida. Esto ocurre en:

Clustering: grupos similares. Consiste en crear grupos similares a partir de características que se puedan medir, por ejemplo, de pacientes, clientes o especies de flores con características similares. No tenemos información sobre ninguna variable de salida.
Reducción dimensional: reducir el número de variables. A veces queremos estudiar la variabilidad, pero las variables de entrada aportan información muy parecida y queremos reducir la dimensionalidad (el número de variables de entrada).
Reglas de asociación: encontrar reglas tipo “si pasa A es muy probable que pase B”.

El mapa de aplicaciones prácticas de ciencia de datos

Es fundamental entender este mapa.

Diagrama, Escala de tiempo

Descripción generada automáticamente

El machine learning se divide en dos tipos de problemas principales: los supervisados y los no supervisados. Los problemas supervisados son aquellos en los que se cuenta con información tanto de la variable de entrada, como de la variable de salida. Hay dos tipos principales:

Regresión, que son aquellos casos en los que la salida es una variable cuantitativa.
Clasificación, donde la salida es una variable cualitativa.

Es decir, depende fundamentalmente de la naturaleza de la variable de salida, la que queremos predecir. Si esta es cuantitativa estaremos ante un problema de regresión, si es cualitativa, estaremos ante un problema de clasificación.

En el machine learning no supervisado, no tenemos información de la salida. Hay varias opciones:

Clustering, que consiste en hacer grupos similares.
Reducción dimensional, que consiste en reducir la dimensionalidad generando menos variables que integran la mayor parte de la variabilidad del problema.
Reglas de asociación, donde la salida es una red de relaciones (si pasa A, es más probable que pase B).

4- Por qué nació el Deep Learning y qué diferencias hay con el machine learning

Si con machine learning podemos hacer prácticamente de todo, ¿Por qué nació el deep learning (aprendizaje profundo)? Y… ¿Qué diferencias existen con el machine learning?

Contestemos a esta pregunta con un ejemplo. ¿Esto es un pájaro?

Un pájaro posado en una rama

Descripción generada automáticamente

Evidentemente para ti, es un pájaro. Esto es así porque lo has aprendido desde bebé y aunque no seas consciente, probablemente hayas visto muchos tipos de pájaros a lo largo de tu vida y los podrías incluso clasificar y diferenciarlo de otros animales que no son pájara. ¿Cómo? Pues probablemente identifiques al pájaro por su forma, porque tiene pico, plumas, patas, etc. Tiene una serie de patrones que tu cerebro ha identificado y que e inconscientemente utiliza para diferenciar a un pájaro de cualquier otro animal.

La idea del Deep learning es eso, que la máquina matemática sepa como extraer características, de forma inconsciente incluso, para poder clasificar. Es decir, a partir de esta imagen, esta máquina matemática va a seleccionar diferentes patrones y va a aprender que esto es un pájaro. Lo va a aprender porque tú se lo vas a decir, le vas a proporcionar muchísimas imágenes de pájaros diferentes e imágenes de cosas que no son pájaros. De esa manera, esta máquina va a indagar en las imágenes, las va a transformar en matrices de datos, en data frames, vectores, etc. A partir de ahí va a ir haciendo sucesivas extracciones de características que le van a permitir diferenciar a un pájaro de algo que no es un pájaro. Una de las principales limitaciones del Deep learning es que requiere de muchísima información de entrenamiento y solo es aplicable si esta información esta disponible.

Machine learning vs Deep learning

La principal diferencia entre machine learning y Deep learning es esta, quién se encarga de la extracción de características. En el Deep learning la extracción de características, o de variables de entrada, no las hace el humano, sino que las hace la misma máquina/algoritmo matemática/o.

En el machine learning clásico, el humano calcula las características que le parecen más relevantes respecto a la variable de salida y a continuación entrena una máquina capaz de clasificar. En cambio, en el aprendizaje profundo, la extracción de características más relevantes y la clasificación se hacen de manera automática. En esta imagen se habla de la red neuronal convolucional, que es la que permite la extracción de características.

Gráfico, Diagrama

Descripción generada automáticamente

Estructura Deep learning

Aquí te dejo una imagen con el esquema básico de funcionamiento de estas herramientas. Partimos de un input de una imagen de un coche. La maquina empieza a extraer diferentes características de esta imagen, diferentes orientaciones, patrones de color, etc. Estos patrones se van a ir organizando en un data frame, y corresponden con las variables de entrada que van a entrenar al modelo. El algoritmo hace este feature extraction se hace de manera automática. El humano solo tiene que diseñar un poco la estructura de la red y ya ella va entrenándose y extrayendo las características más relevantes. La otra etapa es la clasificación (o regresión, dependiendo de la naturaleza de la variable de salida). En esta etapa la red utiliza las características que ha ido extrayendo para generar un clasificador capaz de identificar un coche, de algo que no es un coche. Es el mismo concepto que los modelos de clasificación y regresión del machine learning, la única diferencia es que la extracción de características la hace el algoritmo.

5- Aplicaciones reales del Deep learning

Como ya has podido intuir, las aplicaciones principales del Deep learning son de computer vision (imágenes). También es muy interesante para el análisis de series temporales.

Campos de aplicación de Deep learning

Basicamente se utiliza en:

Detección de fraude
Sistemas de gestión de relaciones con los clientes
Visión por computador
IA vocal
Procesamiento natural del lenguaje
Refinación de datos
Vehículos autónomos
Supercomputadoras
Modelado de inversiones
E-commerce
Inteligencia emocional - robótica
Entretenimiento
Publicidad
Fabricación
Cuidado de la salud

Traducción automática

Como utiliza por ejemplo YouTube cuando grabas un video, te lo pasa a texto.

Las redes neuronales son útiles en la identificación de imágenes que tienen letras visibles. Una vez identificadas, estas se pueden convertir en texto, traducir. Esta aplicación implica traducciones automáticas a otro idioma con un conjunto de palabras, frases u oraciones en un idioma.
Si bien la traducción automática existe desde hace mucho tiempo, el aprendizaje profundo está logrando los mejores resultados en dos áreas específicas:

Traducción automática de texto.
Traducción automática de imágenes

Las traducciones de texto generalmente se realizan sin ningún procesamiento previo. Esto permite que el algoritmo aprenda las dependencias entre palabras para asignarlas a un nuevo idioma.

Asistencia sanitaria

Para el diagnóstico temprano de enfermedades peligrosas.

Ayudar al diagnóstico temprano, preciso y rápido de enfermedades potencialmente mortales, mejorar los resultados en el tratamiento de patologías o la estandarización del curso de los tratamientos, son algunas de las posibles aplicaciones del Deep Learning en la medicina.
Los proyectos de aprendizaje se aceleran en el ámbito de la salud y con el uso del aprendizaje profundo y las redes neuronales, se puede llegar a mitigar los riesgos de las enfermedades, al tiempo que reducen los costes.
La IA también se está utilizando en gran medida en investigaciones clínicas por parte de agencias reguladoras para encontrar curas para enfermedades intratables.

Detección de fraude

Para detección de comportamientos y actividad fraudulenta.

Otro dominio que se beneficia del Deep Learning es el sector bancario y financiero. ¿Y en qué? Pues, fundamentalmente, en la detección de fraudes en las transacciones de dinero digitales.
La prevención y detección de fraudes se realiza con base en la identificación de patrones en las transacciones habituales de los clientes, de tal forma que se pueden identificar comportamientos anómalos y valores atípicos. Para la detección de fraudes se utilizan técnicas de aprendizaje automático de clasificación y regresión y redes neuronales.

Automóviles autónomos

Automóviles que puedan conducir y circular reconociendo su entorno de forma autónoma.

El aprendizaje profundo es la fuerza que está dando vida a la conducción autónoma. Un millón de conjuntos de datos se envían a un sistema para construir un modelo, entrenar a las máquinas para que aprendan y luego probar los resultados en un entorno seguro.
La principal preocupación de los desarrolladores de automóviles autónomos es manejar escenarios desconocidos. Un ciclo regular de pruebas e implementación típico de los algoritmos de aprendizaje profundo garantiza una conducción segura.
Los datos de cámaras, sensores y mapas geográficos están ayudando a crear modelos sofisticados para que las máquinas sean capaces de navegar a través del tráfico, identificar caminos, señalización, rutas solo para peatones y elementos en tiempo real y reaccionar a ellos de la mejor forma posible.

Reconocimiento visual

Por ejemplo, de caras, se centra en la exploración profunda de imágenes.

Gracias al Deep Learning las imágenes se pueden ordenar en función de las ubicaciones detectadas en fotografías, rostros, una combinación de personas, o según eventos, fechas, etc.
El reconocimiento visual a través de redes neuronales profundas está impulsando el crecimiento en este segmento de la administración de medios digitales mediante el uso extensivo de redes neuronales convolucionales desarrolladas con Tensorflow y Python.

Generación automática de escritura a mano

A partir de algo que escriba el usuario.

Esta aplicación de Deep Learning implica la generación de un nuevo conjunto de caligrafías para un corpus dado de una palabra o frase.
La escritura a mano se proporciona esencialmente como una secuencia de coordenadas utilizadas por un bolígrafo. La máquina aprende la relación entre el movimiento de la pluma y las letras y, a partir de estos datos es capaz de generar nuevos escritos.

6- Take away

Lo más importante de la lección:

Los modelos estadísticos tienen el enfoque en la interpretación – investigación. El machine learning en la creación de herramientas.
Machine learning supervisado tiene la misma estructura que un modelo estadístico y el foco está en la predicción
El machine learning no supervisado no tiene información de la salida y el machine learning supervisado sí.
El Deep learning pasa por las etapas de feature extraction y machine learning supervisado de forma automática, en cambio en el machine learning la feature extraction va a cargo del usuario.
Las aplicaciones más comunes del Deep learning.