1 of 16

Sistemas Expertos basados en Redes Neuronales

2 of 16

Conceptos básicos de Redes Neuronales Artificiales (RNA)

  • Definiciones de RNA:
  • “Son modelos Matemáticos construidos inspirados en el funcionamiento de las Redes Neuronales biológicas (Sistema Nervioso), por consiguiente, las unidades de procesamiento fundamental de una RNA, serán las Neuronas Artificiales.
  • Una Red Neuronal Artificial la definiremos como un conjunto de unidades de procesamiento llamados Neuronas, células o nodos, interconectados entre sí por varias ligaduras de comunicación directa llamadas conexiones, con la finalidad de recibir señales de entrada, procesarlas y emitir señales de salida. Cada conexión está asociada a un peso, que representan la información utilizada por las neuronas para resolver un problema”.

3 of 16

Conceptos básicos de RNA

  • Una estructura para representación distribuida

Una red artificial consiste de un conjunto de unidades de procesamiento simple las cuales se comunican enviando señales entre ellos por un largo número de conexiones con peso.

Un conjunto de aspectos principales del modelo distribuido en paralelo puede ser distinguido:

  • Un conjunto de unidades de procesamiento (“neuronas”, “células”)
  • Un estado de activación yk para cada unidad, la cual es equivalente a la salidad de la unidad.
  • Conexiones entre las unidades. Generalmente cada conexión está definida por un pero w jk el cual determina el efecto que la señal de una unidad j tiene en una unidad k.
  • Una regla de propagación que determina la entrada efectiva s k de una unidad de sus entradas externas.
  • Una entrada externa θk para cada unidad.
  • Un método que junta información (la regla de aprendizaje)
  • Un medio ambiente dentro del cual el sistema debe operar, junto a las señales de entrada y si es necesario señales de error.

4 of 16

Ilustración

  • La figura ilustra los conceptos básicos previos.

5 of 16

Representación Comparativa de una Red Neuronal Natural y de una RNA

  • Red Neuronal Natural vs. Red Neuronal Artificial

6 of 16

El problema de identificación de patrones y sus aplicaciones

  • Al margen de la estructura interna de una RNA, para trabajar en el reconocimiento de patrones debemos preocuparnos primeramente de establecer el número de neuronas en la capa de entrada y el número de neuronas en la capa de salida.
  • Considerando a una RNA como una caja negra podremos representar su interacción funcional con el entorno de la siguiente manera.

7 of 16

Identificación de patrones

  • Los Datos de Entrada serán recibidas (leídas) por las Neuronas de Entrada las mismas que serán procesadas por la RNA y los resultados, serán entregados a los Datos de Salida, a través de las Neuronas de Salida.

  • Por lo tanto los Datos de Entrada estarán en relación biunívoca con las Neuronas de Entrada y los Datos de Salida con las Neuronas de Salida lo que significa que a una RNA de n neuronas en la capa de entrada y m neuronas en la capa de salida le corresponderá como Datos de Entrada un vector X de tamaño n [X1, X2, …. Xn] y como Datos de Salida un vector Y de tamaño m [Y1, Y2, …. Ym], estableciéndose entre ellos una dependencia funcional que la podemos llamar RN, y que la podemos expresar de la siguiente manera:

[Y1, Y2, …. Ym] = RN ( [X1, X2, …. Xn] )

8 of 16

Identificación de patrones y Aplicaciones

  • ESTRUCTURA DE DATOS PARA REPRESENTAR LOS CARACTERES NUMERICOS 3, 4 y 5 COMO DATOS DE ENTRADA

Representar los Patrones en una Matriz

  • Un artificio muy interesante para representar tanto letras del abecedario como los dígitos numéricos (A..Z, a..z, 0..9) es usar una matriz de 7 x 6 del modo mostrado:

9 of 16

Continuación Identificación de Patrones

  • El artificio para representar un número en dicha matriz, será poner el valor uno (1) en las celdas por donde pasa la marca del número y el valor cero (0) en caso contrario. Por ejemplo el número tres se podría representar de la siguiente manera:

10 of 16

PLANTEAMIENTO DEL MODELO DE UNA RNA PARA EL RECONOCMIENTO DE LOS CARACTERES NUMERICOS 3, 4 y 5

  • De acuerdo a todo lo indicado anteriormente, el modelo funcional de la RNA para el reconocimientos de los números 3,4 y 5 podría quedar representado por la figura siguiente, donde los Datos de Entrada estarán representados por el vector X = [X1, X2, …. X42] y los Datos de Salida estarán representados por el vector ( Y = [Y1, Y2, Y3] ) .

11 of 16

Continuación del modelo de planeamiento de una RNA

  • Tomando como ejemplo la imagen del número 3 mostrada anteriormente, una representación gráfica más completa de los Datos de Entrada y los Datos de Salida sería la siguiente:

  • Se puede apreciar que el vector X almacena la representación gráfica bidimensional del número 3 contenida en una matriz de 7 x 6 mientras que el vector Y tiene el valor [1, 0, 0] que indica que la imagen reconocida por la RNA corresponde al primer elemento en nuestro caso al número 3.

12 of 16

Algoritmos de RNA para identificación de patrones

  • a) Arquitectura sin retroalimentación
  • B) Arquitectura con retroalimentación

13 of 16

Continuación del algoritmo de RNA

  • Un reciente estudio ha mostrado que aproximadamente 95% de las aplicaciones reportadas de redes neuronales en los negocios utilizan redes neuronales sin retroalimentación multicapas con algoritmo de aprendizaje de retro-propagación.
  • La retro-propagación es una red sin retroalimentación mostrada en la figura anterior que actualiza los pesos iterativamente para mapear un conjunto de vectores de entrada hacia un conjunto de vectores de salida.
  • La entrada xp correspondiente a la forma o punto de entrada “p” es presentada a la red y multiplicada por los pesos. Todas las entradas de los pesos para cada unidad de la capa superior son sumados y producen una salida gobernada por las siguientes ecuaciones:

14 of 16

Continuación del algoritmo con RNA

  • donde Wo y Wh son las matrices de salida y la de peso de la capa oculta, hp es el vector que denota la respuesta de la capa oculta para la forma “p”, θo y θh son los vectores de salida e inclinado de la capa oculta, respectivamente y f(.) es la función de activación sigmoidal. La función de costo para minimizar en la retropropagación estándar es la suma del error al cuadrado definido como:

  • Donde tp es el vector objetivo de salida para la forma “p”. El algoritmo usa la técnica de gradiente descendiente para ajustar los pesos de conexión entre las neuronas.

15 of 16

Consideraciones para resolver problemas basados en el conocimiento a través de RNA

Se debe tener presente las características de las RNA que son, como apreciaremos muy semejantes a las de las Redes Neuronales Biológicas, entre las principales podemos mencionar las siguientes:

  • Aprenden a través de ejemplos
  • Inferencia estadística
  • Adaptabilidad
  • Dilema plasticidades y estabilidad
  • Capacidades de generalización
  • Tolerante a fallas.
  • Rápida implantación

16 of 16

Bibliografía

  • RISI 2009 – II : Reconocimiento de Patrones mediante Redes Neuronales : Hugo Vega Huerta, Augusto Cortez Vásquez, Ana María Huayna Dueñas, Luís Alarcón Loayza.
  • An introduction to Neural Networks, Ben Krose y Patrick van der Smagt 8a Edición Noviembre 1996
  • Artificial Neural Networks in Finance and Manufacturing, Joarder Kamruzzaman, Rezaul K. Begg y Ruhul A. Sarker , 2006.