Universidad Nacional del Nordeste

Facultad de Ciencias Exactas, Naturales y Agrimensura

Trabajo de Adscripción Minería de Datos

Adscripta: Sofia J. Vallejos - L.U.: 37.032 Materia: Diseño y Administración de Datos Director: Mgter. David Luis la Red Martínez

Licenciatura en Sistemas de Información Corrientes - Argentina

2006



ii



Índice General

1 Inteligencia de Negocios 1 1.1 Business Intelligence . . . . . . . . . . . . . . . . . . . . . . . . 1 1.2 ¿Qué es Business Intelligence? . . . . . . . . . . . . . . . . . . . 2 1.3 Componentes de Business Intelligence . . . . . . . . . . . . . . 3

2 Introducción 5 2.1 Descubrimiento de Conocimiento en Bases de Datos (KDD) . 5 2.2 Concepto del KDD . . . . . . . . . . . . . . . . . . . . . . . . . 6 2.2.1 Metas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 2.3 Relación con otras disciplinas . . . . . . . . . . . . . . . . . . . 8 2.4 El proceso de KDD . . . . . . . . . . . . . . . . . . . . . . . . . 8

3 Mineria de Datos - Data Mining 11 3.1 Conceptos e Historia . . . . . . . . . . . . . . . . . . . . . . . . 11 3.1.1 Los Fundamentos del Data Mining . . . . . . . . . . . . 12 3.2 Principales características y objetivos de la Minería de Datos . 13 3.3 El Alcance de Data Mining . . . . . . . . . . . . . . . . . . . . 15 3.4 Una arquitectura para Data Mining . . . . . . . . . . . . . . . 16

4 Fases de un Proyecto de MD y Aplicaciones de Uso 17 4.1 Fases de un Proyecto de Minería de Datos . . . . . . . . . . . . 17 4.1.1 Filtrado de datos . . . . . . . . . . . . . . . . . . . . . . 17 4.1.2 Selección de variables . . . . . . . . . . . . . . . . . . . 18 4.1.3 Algoritmos de Extracción de Conocimiento . . . . . . . 18 4.1.4 Interpretación y evaluación . . . . . . . . . . . . . . . . 19 4.2 Aplicaciones de Uso . . . . . . . . . . . . . . . . . . . . . . . . 19 4.2.1 En el Gobierno: . . . . . . . . . . . . . . . . . . . . . . . 19 4.2.2 En la Empresa . . . . . . . . . . . . . . . . . . . . . . . 20 4.2.3 En la Universidad . . . . . . . . . . . . . . . . . . . . . 21

iii



iv ÍNDICE GENERAL

4.2.4 En Investigaciones Espaciales . . . . . . . . . . . . . . . 22 4.2.5 En los Clubes Deportivos . . . . . . . . . . . . . . . . . 23

5 Extensiones del Data Mining 25 5.1 Web mining . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 5.2 Text mining . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

6 Conclusión 29

Bibliografía 31



Índice de Figuras

1.1 Ilustración del B.I. . . . . . . . . . . . . . . . . . . . . . . . . . 3

2.1 Jerarquía del Conocimiento. . . . . . . . . . . . . . . . . . . . . 7 2.2 Proceso de KDD . . . . . . . . . . . . . . . . . . . . . . . . . . 9

4.1 Fases del Proyecto de M.D. . . . . . . . . . . . . . . . . . . . . 18

v





Capítulo 1

Inteligencia de Negocios

1.1 Business Intelligence

Algo peor que no tener información disponible es tener mucha información y no saber qué hacer con ella. La Inteligencia de Negocios o Business Intelligen- ce (BI) es la solución a ese problema, pues por medio de dicha información puede generar escenarios, pronósticos y reportes que apoyen a la toma de de- cisiones, lo que se traduce en una ventaja competitiva. La clave para BI es la información y uno de sus mayores beneficios es la posibilidad de utilizarla en la toma de decisiones. En la actualidad hay una gran variedad de software de BI con aplicaciones similares que pueden ser utilizados en las diferentes áreas de la empresa, tales como, ventas, marketing, finanzas, etc. Son muchas las empresas que se han beneficiado por la implementación de una sistema de BI, además se pronostica que con el tiempo se convertirá en una necesidad de toda empresa.

En este nuevo mundo, la información reina afirma Geoffrey A. Moore, Director de Chasm Group. Vivimos en una época en que la información es la clave para obtener una ventaja competitiva en el mundo de los negocios. Para mantenerse competitiva una empresa, los gerentes y tomadores de decisiones requieren de un acceso rápido y fácil a información útil y valiosa de la empresa. Una forma de solucionar este problema es por medio del uso de Business Intelligence o Inteligencia de Negocios.

1



2 CAPÍTULO 1. INTELIGENCIA DE NEGOCIOS

1.2 ¿Qué es Business Intelligence?

La Inteligencia de Negocios o Business Intelligence (BI) se puede definir como el proceso de analizar los bienes o datos acumulados en la empresa y extraer una cierta inteligencia o conocimiento de ellos. Dentro de la categoría de bienes se incluyen las bases de datos de clientes, información de la cadena de suministro, ventas personales y cualquier actividad de marketing o fuente de información relevante para la empresa.

BI apoya a los tomadores de decisiones con la información correcta, en el momento y lugar correcto, lo que les permite tomar mejores decisiones de ne- gocios. La información adecuada en el lugar y momento adecuado incrementa efectividad de cualquier empresa.

La tecnología de BI no es nueva, ha estado presente de varias formas por lo menos en los últimos 20 años, comenzando por generadores de reportes y sistemas de información ejecutiva en los 80’s Afirma Candice Goodwin . Entiéndase como sinónimos de tecnología de BI los términos aplicaciones, so- luciones o software de inteligencia de negocios.

Para comprender mejor el concepto se sita el siguiente ejemplo. Una fran- quicia de hoteles a nivel nacional que utiliza aplicaciones de BI para llevar un registro estadístico del porcentaje promedio de ocupación del hotel, así como los días promedio de estancia de cada huésped, considerando las diferencias entre temporadas. Con esta información ellos pueden:

• Calcular la rentabilidad de cada hotel en cada temporada del año.

• Determinar quién es su segmento de mercado.

• Calcular la participación de mercado de la franquicia y de cada hotel.

• Identificar oportunidades y amenazas.

Estas son sólo algunas de las formas en que una empresa u organización se puede beneficiar por la implementación de software de BI, hay una gran variedad de aplicaciones o software que brindan a la empresa la habilidad de analizar de una forma rápida por qué pasan las cosas y enfocarse a patrones y amenazas. En la figura 1.1 de la página 3 se ilustra lo antes mencionado.



1.3. COMPONENTES DE BUSINESS INTELLIGENCE 3

Figura 1.1: Ilustración del B.I.

1.3 Componentes de Business Intelligence

Todas las soluciones de BI tienen funciones parecidas, pero deben de reunir al menos los siguientes componentes:

• Multidimensionalidad: la información multidimensional se puede encon- trar en hojas de cálculo, bases de datos, etc. Una herramienta de BI debe de ser capaz de reunir información dispersa en toda la empresa e incluso en diferentes fuentes para así proporcionar a los departamentos la accesibilidad, poder y flexibilidad que necesitan para analizar la in- formación. Por ejemplo, un pronóstico de ventas de un nuevo producto en varias regiones no está completo si no se toma en cuenta también el comportamiento histórico de las ventas de cada región y la forma en que la introducción de nuevos productos se ha desarrollado en cada región en cuestión.

• Data Mining: Las empresas suelen generar grandes cantidades de infor- mación sobre sus procesos productivos, desempeño operacional, merca- dos y clientes. Pero el éxito de los negocios depende por lo general de la habilidad para ver nuevas tendencias o cambios en las tendencias. Las aplicaciones de data mining pueden identificar tendencias y comporta- mientos, no sólo para extraer información, sino también para descubrir las relaciones en bases de datos que pueden identificar comportamientos



4 CAPÍTULO 1. INTELIGENCIA DE NEGOCIOS

que no muy evidentes.

• Agentes: Los agentes son programas que piensan. Ellos pueden realizar tareas a un nivel muy básico sin necesidad de intervención humana. Por ejemplo, un agente pueden realizar tares un poco complejas, como elaborar documentos, establecer diagramas de flujo, etc.

• Data Warehouse: Es la respuesta de la tecnología de información a la descentralización en la toma de decisiones. Coloca información de todas las áreas funcionales de la organización en manos de quien toma las decisiones. También proporciona herramientas para búsqueda y análisis.