1 of 220

ESTADÍSTICA

JOSÉ FRANCISCO LUGO PINTO

2 of 220

3 of 220

TEXTO DE CONSULTA

4 of 220

QUÉ ES LA ESTADÍSTICA?

Ciencia que utiliza conjuntos de datos numéricos para obtener análisis, interpretaciones e inferencias basadas en el cálculo de probabilidades.

5 of 220

Estadística

6 of 220

7 of 220

QUÉ SON LAS VARIABLES?

La variable estadística es una característica o cualidad de un individuo que está propensa a adquirir diferentes valores. Estos valores, a su vez, se caracterizan por poder medirse. .

8 of 220

¿QUÉ DIFERENCIA HAY ENTRE LA ESTADÍSTICA DESCRIPTIVA Y LA ESTADÍSTICA INFERENCIAL?

Estadística descriptiva es el conjunto de técnicas que se encargan de:,

organizar, resumir, presentar y describir los datos de manera informativa.

Los medios útiles para la presentación y descripción de datos son

frecuencia los gráficos medidas de tendencia central de variabilidad etcétera

Estadística inferencial es el conjunto de técnicas que se encargan de estimar

los parámetros poblacionales a partir de una muestra. La estimación depende las

técnicas estadísticas usadas qué se tomó la muestra siente el estadístico de la muestra

el parámetro de la población se denomina error muestral

9 of 220

variables

categóricas

numéricas

discretas

continuas

endógenas

exógenas

independientes

dependientes

probabilísticas

deterministicas

binomiales

TIPOS DE VARIABLES ESTADÍSTICAS

10 of 220

variables

categóricas

TIPOS DE VARIABLES ESTADÍSTICAS

Una variable categórica es una variable con un número limitado de valores distintos o categorías (por ejemplo, sexo o religión). Las variables categóricas pueden ser nominales u ordinales.

Una variable nominal es un tipo de variable estadística de tipo cualitativo que expresa con nombre una cualidad no necesariamente ordenable. ... Por ejemplo, decir que Juan tiene los ojos verdes, es el caso de una variable nominal.

Una variable ordinal es un tipo de variable estadística de tipo cuantitativo que expresa con números una cualidad que se puede ordenar.

Ejemplo, calificación crediticia, calificación de una prueba, posición en una carrera, satisfacción del cliente con un servicio.

11 of 220

variables

categóricas

numéricas

TIPOS DE VARIABLES ESTADÍSTICAS

Las variables numéricas, que son aquellas que representan números y con ellas se pueden realizar operaciones aritméticas.

Por ejemplo, número de hijos, número de alumnos que hay en un clase o el peso de una persona

12 of 220

variables

categóricas

numéricas

discretas

TIPOS DE VARIABLES ESTADÍSTICAS

Se dice que una variable es discreta cuando no puede tomar ningún valor intermedio entre dos unidades consecutivos.

Ejemplo, número de hijos, número de empleados de una factoria, número de pares de zapatos.

13 of 220

variables

categóricas

numéricas

discretas

continuas

TIPOS DE VARIABLES ESTADÍSTICAS

Se dice que una variable es continua cuando puede tomar cualquier valor definido en un intervalo tomado como referencia.

Ejemplo, temperatura en un proceso productivo, presión dentro de una caldera, medida de torsión de un eje.

14 of 220

variables

categóricas

numéricas

discretas

continuas

endógenas

TIPOS DE VARIABLES ESTADÍSTICAS

Una variable endógena es aquella cuyo valor está determinado por las relaciones establecidas dentro del modelo en el que está incluida.

ejemplos, El nivel de producción de una empresa definido a partir de material en inventario y la mano de obra disponible.

15 of 220

variables

categóricas

numéricas

discretas

continuas

endógenas

exógenas

TIPOS DE VARIABLES ESTADÍSTICAS

Una variable exógena es aquella cuyo valor está determinado por externalidades a la situación o modelo bajo estudio.

ejemplos, El punto de equilibrio entre la oferta y la demanda de un mercado, la tasa de cambio del dólar en Colombia.

16 of 220

variables

categóricas

numéricas

discretas

continuas

endógenas

exógenas

independientes

TIPOS DE VARIABLES ESTADÍSTICAS

Un variable independiente es una variable que representa una atributo que puede tomar diferentes valores sin depender del comportamiento de otras variables en un experimento, situación o suceso.

Ejemplo, variables físicas como corriente, voltaje, temperatura, presión.

17 of 220

variables

categóricas

numéricas

discretas

continuas

endógenas

exógenas

independientes

dependientes

TIPOS DE VARIABLES ESTADÍSTICAS

La variable dependiente es aquella que, dentro de un modelo económico o estadístico, esta supeditada al comportamiento o fluctuaciones de otras variables a las que denominamos independientes.

Ejemplo, dilatación de una platina metálica que puede depender de la temperatura a la que está expuesta.

18 of 220

variables

categóricas

numéricas

discretas

continuas

endógenas

exógenas

probabilísticas

TIPOS DE VARIABLES ESTADÍSTICAS

En estas variables, el proceso de medición, solamente se considera como una probabilidad. Si se realizan mediciones repetidas a la misma variable, es probable encontrar diferencias, por tanto, en algunos casos se especifica el rango de variabilidad de una variable.

Ejemplo, la molaridad de una solución en el área de la química.

19 of 220

variables

categóricas

numéricas

discretas

continuas

endógenas

exógenas

deterministicas

TIPOS DE VARIABLES ESTADÍSTICAS

En estas variables, el proceso de medición puede arrojar el mismo resultado a pesar de que se modifiquen diferentes aspectos del experimento.

Ejemplo, valor de la gravedad.

20 of 220

variables

categóricas

numéricas

discretas

continuas

endógenas

exógenas

binomiales

TIPOS DE VARIABLES ESTADÍSTICAS

La variable aleatoria binomial es una variable aleatoria discreta. Representa el número de aprobados entre n pruebas aplicadas: Para cada prueba, son posibles dos tipos de resultados: A (éxito) y A* (fracaso).

Ejemplo, La presencia del No. 7 en el resultado del premio mayor de la lotería.

21 of 220

variables

categóricas

numéricas

discretas

continuas

endógenas

exógenas

independientes

dependientes

probabilísticas

deterministicas

binomiales

TIPOS DE VARIABLES ESTADÍSTICAS

22 of 220

UNIVERSO, POBLACIÓN, MUESTRA Y TAMAÑO DE MUESTRA

UNIVERSO. Conjunto de unidades de observaciones que pueden tener caracterización similares a los cuerpos que se incorporarán al estudio.

del latín universum ‘conjunto de todas las cosas’, compuesto de unus ‘uno’ y versus, participio pasivo de vertere ‘girar’

POBLACIÓN Conjunto de elementos que presentan una característica común y que pueden ser utilizados en la exploración.

La palabra población tiene el significado de "conjunto de personas que habitan un lugar" y viene del sufijo -ción (acción y efecto) sobre el verbo "poblar", de "pueblo" y este del latín populus = "conjunto de todos los ciudadanos varones".

MUESTRA. Subconjunto de individuos que interesan al investigador porque cumplen con unos requisitos en su perfil.

La palabra muestra (parte representativa, ejemplar, espécimen, prototipo) viene del latín monstrare (mostrar). De ahí también las palabras monstruo, mostrar, demostrar, amostrar y premostrar.

TAMAÑO DE LA MUESTRA. Delimitación aleatoria definida a partir de la aplicación de formulas matemáticas.

Voz patrimonial procedente de la contracción del latín tam magnus ‘tan grande’, que, al sustantivarse, ha pasado a designar el volumen del objeto. Magnus era el adjetivo básico latino para expresar la noción de grande, pero fue sustituido en latín vulgar por grandis (V. grande ). A la misma familia etimológica latina derivada de magnus ‘grande’ pertenecen magnánimo, magnate, magnífico y magnitud .

23 of 220

UNIVERSO, POBLACIÓN, MUESTRA Y TAMAÑO DE MUESTRA

24 of 220

UNIVERSO, POBLACIÓN, MUESTRA Y TAMAÑO DE MUESTRA

Grupo objetivo

Universo

Muestra

Población

25 of 220

DEFINICIONES BÁSICAS �

Fenómeno aleatorio: Es aquel que bajo el mismo conjunto aparente de condiciones iniciales, puede presentar resultados diferentes

Espacio de resultados: O espacio muestral, Ω, es el conjunto de todos los posibles resultados de un experimento aleatorio.

Confiabilidad: Grado de exactitud en que una prueba, un experimento o un instrumento de medición entrega resultados sobre el fenómeno bajo estudio.

Franja de incertidumbre: el valor de la semi-amplitud de un intervalo que se extiende a un lado y al otro del valor resultante de la medida, que se entiende como el valor convencionalmente verdadero.

Variable: Derivada del término en latín variabilis, variable es una palabra que representa a aquello que varía o que está sujeto a algún tipo de cambio. Se trata de algo que se caracteriza por ser inestable, inconstante y mudable y afectar los resultados de un fenómeno.

Dato: Categorización de la información concreta de hechos, que permite estudiarlos, analizarlos o conocerlos

Registro: Lectura del comportamiento de una variable.

Formato: Documento que consigna registros con la intención de vincular evidencia y facilitar la trazabilidad de hechos.

26 of 220

EJEMPLO

Un conocido fabricante de medicamentos en Colombia, desea conocer la proporción de personas cuya diabetes tipo 2, puede ser controlada con un nuevo fármaco. Se realiza un estudio en Bogotá, Medellín, Cali y Barranquilla con 3500 personas con esta diabetes. Se debe aplicar en la investigación la siguiente tabla de muestreo:

Bogotá, 37%; Medellín, 28%; Cali 21%;Barranquilla 14%. Se deben considerar participantes del 70% para hombres y 30% para mujeres.

Defina:

  • Universo.
  • Población.
  • Muestra.
  • Grupo objetivo
  • Tamaño de la muestra.
  • Estructure la tabla de tabulación básica.

27 of 220

CONCEPTO TEÓRICO�

28 of 220

DIFERENTES TIPOS DE FUNCIONES

1. Función Lineal

29 of 220

DIFERENTES TIPOS DE FUNCIONES

2. Función cuadrática

30 of 220

DIFERENTES TIPOS DE FUNCIONES

3. Función cúbica

31 of 220

DIFERENTES TIPOS DE FUNCIONES

4. Función polinómica

(para el estudiante)

Apropiar

ejemplo

de este

tipo de

función.

32 of 220

DIFERENTES TIPOS DE FUNCIONES

5. Función exponencial

33 of 220

DIFERENTES TIPOS DE FUNCIONES

6. Función logarítmica

34 of 220

REPRESENTACIÓN GRÁFICA

35 of 220

EJERCICIO DE ANÁLISIS GRÁFICO

36 of 220

Y = 3/2 X

37 of 220

Y = 2 Sen X

38 of 220

39 of 220

EJERCICIO UNO

40 of 220

EJERCICIO UNO

41 of 220

EJERCICICOS DE APLICACIÓN�

Construya y compare las siguientes funciones

42 of 220

ANÁLISIS E INTERPRETACIÓN GRÁFICA�

  • Grafique a partir de la siguiente información

43 of 220

44 of 220

45 of 220

EJERCICIO DOS

2 Construya y presente un ejemplo de gráfico de doble eje.

  1. Utilizando Excel realice un gráfico personalizado.

https://www.youtube.com/watch?v=FCj2YworGFg

46 of 220

EJERCICIO DOS

3. Interprete el siguiente gráfico

47 of 220

MANEJO DE INFORMACIÓN

48 of 220

MANEJO DE INFORMACIÓN ESTADÍSTICA�1 DE 2

Apropiación de modelo de trabajo

Identificación de necesidad

Definición de objetivo

Tabulación de la información

Captura de información

Organización de la información

Revisión de la información

49 of 220

MANEJO DE INFORMACIÓN ESTADÍSTICA�2 DE 2

Estructuración gráfica de registros

Depuración de la información

Procesamiento de la información

Socialización de la información

Análisis de la información

Consolidación de informes

50 of 220

DETECTAR FALTANTES EN LISTAS

51 of 220

EJERCICIO

Identificar, investigar, construir elaborar un ejemplo con cada uno de los siguientes gráficos:

  • Combinado.
  • De jerarquía.
  • Radial.

52 of 220

SERIES DE DATOS �Y� VALORES AGRUPADOS

53 of 220

CONSULTA

54 of 220

MEDIDAS DE TENDENCIA CENTRAL

Las medidas de tendencia central (o de centralización) son medidas que tienden a localizar en qué punto se encuentra la parte central de un conjunto ordenado de datos de una variable cuantitativa.

Las principales medidas de tendencia central son:

Media

Moda

Mediana

Media armónica

Media geométrica

Media aritmética

Media cuadrática

55 of 220

¿QUÉ ES UNA SERIE TEMPORAL?

¿QUÉ ES UNA SERIE ESTADÍSTICA?

Una serie de datos es un conjunto de datos que se muestra en un gráfico. 

Una serie temporal es una variable estadística cuyas observaciones están ordenadas temporalmente. Por ejemplo, los datos trimestrales de la E.P.A. ... Una variable estadística cuyos valores varían a lo largo del tiempo, recibe el nombre de serie temporal o serie cronológica.

56 of 220

¿QUÉ ES UNA SERIE DE DATOS?

57 of 220

EJERCICIO

58 of 220

TOME LA INFORMACIÓN SUMINISTRADA, TABULE, COMPLETE LA TABLA PARA VER EL NIVEL DE PARTICIPACIÓN DE CADA MARCA DE SOLDADURA Y GRAFIQUE

Marca Repeticiones de uso

Soldeurop 54

SoldoK 44

Tekasol 130

Thor 52

Tracksold 84

59 of 220

INTERPRETACIÓN GRÁFICA

60 of 220

CONSULTA SOBRE SERIES

61 of 220

¿CÓMO SE DENOTA UNA SERIE ESTADÍSTICA MATEMÁTICAMENTE?

62 of 220

TABLA DE FRECUENCIAS

Una tabla de frecuencia corresponde a un ordenamiento definido para manejar información representada por registros de manera ordenada, sistemática, clara y coherente.

En términos generales las tablas se clasifican en:

  • Tabla de frecuencia simple.
  • Tabla de frecuencia en intervalos.

63 of 220

TABLAS ESTADÍSTICAS

64 of 220

TABLAS ESTADÍSTICAS

65 of 220

EJEMPLO DE TABLA SIMPLE

Edades de estudiantes de un curso libre de robótica para adolescentes

66 of 220

EJEMPLO DE TABLA DE FRECUENCIA�ORDENADA POR INTERVALOS

67 of 220

TABLA DE UNA ENTRADA

68 of 220

TABLA DE DOS ENTRADAS

69 of 220

TABLA COMPLEJA

70 of 220

DECISIÓN �SOBRE LA TABLA DE FRECUENCIA QUE SE DEBE APLICAR

71 of 220

FUNCIÓN LINEAL EN ESTADÍSTICA�

72 of 220

ESPACIO DE TRABAJO

73 of 220

EJERCICIOS BÁSICOS

No. Fibras

Resistencia

4

134

6

145

8

142

10

149

12

144

14

160

16

156

18

157

20

168

22

166

24

167

26

171

28

174

30

183

Se tienen los datos de la tabla A que consolidan la información de una fibra que se esta probando para trabajos en el laboratorio de ensayo de la firma instruments ORSO.

Tabla A

74 of 220

CONSTRUYA EL GRÁFICO

75 of 220

Vamos a buscar analizar el modelo matemático que pueda expresar

de manera adecuada la relación entre las variables…

76 of 220

Vamos a buscar analizar el modelo matemático que pueda expresar

de manera adecuada la relación entre las variables…

Revisamos que tenemos 14 datos,

Por lo tanto n = 14

Ahora completamos la tabla de trabajo…

77 of 220

EN UNA TABLA DE TRABAJO PREPARE LA SIGUIENTE INFORMACIÓN:

Y

X

X2

XY

ƩY

ƩX

ƩX2

ƩXY

  1. Vamos a asumir el No. de fibras como columna Y y la resistencia como la columna X
  2. Transcribimos la información y completamos el resto de la tabla solicitada.

78 of 220

¿PARA QUE NOS SERVIRÁ?

79 of 220

PARA VERIFICAR �EL NIVEL DE CORRELACIÓN DE LAS DOS VARIABLES

80 of 220

OBTENEMOS �LA ECUACIÓN DE CORRELACIÓN LINEAL �Y EL COEFICIENTE DE CORRELACIÓN

81 of 220

HABILITAR ANÁLISIS EN EXCEL

82 of 220

REGRESIÓN LINEAL

83 of 220

CORRELACIÓN LINEAL�YCOEFICIENTE DE CORRELACIÓN

84 of 220

REGRESIÓN LINEAL �Y �DIAGRAMAS DE DISPERSIÓN

85 of 220

REGRESIÓN LINEAL

Regresión lineal: método causal en el que una variable (conocida como variable dependiente), está relacionada con una o más variables independientes por medio de una ecuación lineal .

También se podría decir que es una técnica de modelado estadístico que se emplea para describir una variable de respuesta continua como una función de una o varias variables predictoras. Puede ayudar a comprender y predecir el comportamiento de sistemas complejos o a analizar datos experimentales, financieros y biológicos.

86 of 220

DIAGRAMAS DE DISPERSIÓN

Un diagrama de dispersión o gráfica de dispersión o gráfico de burbujas grafico de bolas es un tipo de diagrama matemático que utiliza las coordenadas cartesianas para mostrar los valores de dos variables para un conjunto de datos.

https://www.ingenioempresa.com/diagrama-de-dispersion/

https://www.aiteco.com/diagrama-de-dispersion/

87 of 220

CONCEPTOS

Variable dependiente: Variable que se desea pronosticar y cuyo comportamiento depende de las variables independientes.

Variable independiente: Variable que puede tomar valores caprichosos valores predefinidos de acuerdo al concepto del investigador OA comportamientos o trayectorias que se piden a partir del escenario propuesto dentro de las características del análisis.

88 of 220

EN LA PRÁCTICA…

Conclusión

Definición de variables

Suposición

Análisis

Suposición

Mediante procesos lógicos se determina la dependencia de la variable base con respecto a otras variables que pueden afectar los resultados del experimento o D la situación bajo estudio.

Sí en el caso analizado una sola variable independiente explica el comportamiento de la variable dependiente estamos ante un caso de regresión lineal simple. si por el contrario el comportamiento de la variable dependiente está supeditado a muchas variables estamos ante un caso de regresión lineal múltiple.

89 of 220

OTROS CONCEPTOS

Coeficiente de correlación (R): Es una medida que indica el nivel de asociación entre las variables dependiente e independiente en un modelo de regresión lineal.

Coeficiente de determinación (R2): En un modelo de regresión lineal es una medida que indica porcentualmente el cambio de la variable dependiente con respecto al comportamiento de la independiente.

90 of 220

REGRESIÓN LINEAL

91 of 220

MÍNIMOS CUADRADOS

92 of 220

93 of 220

Correlación negativa

Débil

94 of 220

EJERCICIO

Una empresa requiere saber si existe una relación confiable entre el presupuesto que se gasta en publicidad y el resultado de las ventas .

Se van a tomar como referencia los 10 períodos anteriores y se espera proyectar a partir del análisis estadístico cuál podría ser el resultado en el ingreso por ventas si se hace una inversión de 8000 dólares para el periodo onceavo.

A continuación se presenta la tabulación del comportamiento de los 10 períodos tomados como referencia:

95 of 220

período

8Inversión en Publicidad

Ventas

1

5000

160000

2

5570

189380

3

4350

139200

4

7900

260700

5

6800

217600

6

5400

183600

7

6900

234600

8

3900

136500

9

4200

138600

10

5780

202300

96 of 220

RESULTADOS Y CONCLUSIONES

Con R2= 0,9783 = 97,83%

Se concluye que si es confiable la relación entre la inversión en publicidad y las ventas.

Las ventas responden en los cambios en publicidad en un 98%.

Y = a + bX

La ecuación queda definida como: Y = 32,819X + 3116,1

Para el periodo 11 se esperaría un resultado en ventas de 265.671

R = 0.98909049131

97 of 220

Video de referencia:

Regresión lineal Simple

98 of 220

REGRESIÓN LINEAL MÚLTIPLE 1 DE 2

99 of 220

REGRESIÓN LINEAL MÚLTIPLE 2 DE 2

100 of 220

REGRESIÓN LINEAL MÚLTIPLE 2 DE 2

101 of 220

EJERCICIO DE ANÁLISIS

Si se tiene el siguiente modelo de regresión lineal:

  1. ¿Cuál será su representación gráfica?

  • ¿Cuál será su representación matricial por vectores?

102 of 220

Predictores

Parámetros o

Coeficientes de regresión

Intersepto

Variable de respuesta

103 of 220

¿Para a) se pueden considerar las siguientes alternativas?

104 of 220

Se pueden trazar las rectas

propuestas como solución

en un espacio tridimensional

tomando como referencia la

definición del modelo.

105 of 220

y

X2

X1

Se genera un plano a partir de la unificación y la definición de las dos rectas que se definen a partir de los modelos de análisis individual

106 of 220

Se genera un plano completado con segmentos en color verde a partir de la union de las rectas obtenidas de los análisis individuales.

Se puede argumentar de esta manera que la recta que represente el modelo estará ubicada en el plano obtenido de la forma descrita.

SOLUCIÓN

107 of 220

EJEMPLO REGRESIÓN LINEAL MÚLTIPLE

108 of 220

EXTRAPOLACIÓN

La extrapolación es el proceso de encontrar un valor fuera de un conjunto de datos.

En el siguiente video encontrará la forma de aplicar la extrapolación y el ajuste de base.

https://www.youtube.com/watch?v=9c8ffQQzJyk

Construya un ejemplo para obtener extrapolación, deduzca las formulas y grafique en Excel. 

109 of 220

Varianza, desviación estándar y coeficiente de variación

Este tipo de medidas son parámetros informativos que nos permiten conocer como los valores de los datos se reparten a través de eje X, mediante un valor numérico que representa el promedio de dispersión de los datos. .

MEDIDAS DE DISPERSIÓN

110 of 220

EJEMPLO

A partir de la siguiente información organice la tabla y grafique:

  • Mediante método básico
  • Utilizando la hoja electrónica

111 of 220

Depurando el gráfico…

Aplicando

línea de tendencia

112 of 220

Depurando el gráfico…

Aportando

ecuación

y la varianza

113 of 220

MEDIDAS DE DISPERSIÓN

Las medidas de dispersión tratan, a través del cálculo de diferentes fórmulas, de arrojar un valor numérico que ofrezca información sobre el grado de variabilidad de una variable.

https://economipedia.com/definiciones/medidas-de-dispersion.html

114 of 220

¿QUÉ ES EL COEFICIENTE DE VARIACIÓN?

El coeficiente de variación, también denominado como coeficiente de variación de Pearson, es una medida estadística que nos informa acerca de la dispersión relativa de un conjunto de datos.

Se utiliza al igual que otras medidas de dispersión, de si una variable se mueve mucho, poco, más o menos que otra.

115 of 220

¿QUÉ ES EL COEFICIENTE DE DETERMINACIÓN?

El coeficiente de determinación es la proporción de la varianza total de la variable explicada por la regresión. El coeficiente de determinación, también llamado R cuadrado, refleja la bondad del ajuste de un modelo a la variable que pretender explicar.

el resultado del coeficiente de determinación oscila entre 0 y 1. Cuanto más cerca de 1 se sitúe su valor, mayor será el ajuste del modelo a la variable que estamos intentando explicar.

116 of 220

¿QUÉ ES LA COVARIANZA?

La covarianza es el valor que refleja en qué cuantía dos variables aleatorias varían de forma conjunta respecto a sus medias.

Covarianza (X,Y)  es menor que cero cuando “X” sube e “Y” baja. Hay una relación negativa.

Covarianza (X,Y)  es mayor que cero cuando “X” sube e “Y” sube. Hay una relación positiva.

Covarianza (X,Y)  es igual que cero cuando no hay relación existente entre las variables “X” e “Y”.

117 of 220

3 FORMAS PARA OBTENER EL COEFICIENTE DE CORRELACIÓN DE PEARSON

118 of 220

ESCALA DE VALORACIÓN DE COEFICIENTE DE PEARSON

1

0

0,7

-1

0,4

-0,7

-0,4

R = ?

119 of 220

COEFICIENTE DE CORRELACIÓN DE PEARSON

120 of 220

Obtenemos el coeficiente de correlación de Pearson

121 of 220

MÉTODO DE MÍNIMOS CUADRADOS

Lectura:

Video guía:

122 of 220

MÉTODO DE LOS MÍNIMOS CUADRADOS

123 of 220

MEDIDAS DE TENDENCIA CENTRAL

Media, mediana y moda

Son medidas estadísticas que se usan para describir como se puede resumir la localización de los datos. Ubican e identifican el punto alrededor del cual se centran los datos. Las medidas de tendencia central nos indican hacia donde se inclinan o se agrupan más los datos.

124 of 220

VARIANZA, DESVIACIÓN ESTÁNDAR Y COEFICIENTE DE VARIACIÓN

125 of 220

COEFICIENTE DE CORRELACIÓN DE PEARSON�

126 of 220

5 MEDIDAS DE CORRELACIÓN

127 of 220

MEDIA, MEDIANA Y MODA

Interpretación media, mediana y moda

https://www.youtube.com/watch?v=JwsfkIy6B_o

128 of 220

DOCUMENTO GUÍA

129 of 220

DECISIÓN �SOBRE LA TABLA DE FRECUENCIA QUE SE DEBE APLICAR

130 of 220

HISTOGRAMA Y POLÍGONO DE FRECUENCIAS

Histograma

Un histograma es la representación gráfica en forma de barras, que simboliza la distribución de un conjunto de datos. Sirven para obtener una "primera vista" general, o panorama, de la distribución de la población, o de la muestra, respecto a una característica, cuantitativa y continua..

131 of 220

HISTOGRAMA Y POLÍGONO DE FRECUENCIAS

Poligono de frecuencias

Son diagramas de línea que se obtienen al unir los puntos medios del lado superior de cada rectángulo del histograma correspondiente. ... Recuerda que el histograma y el polígono de frecuencias son gráficos que se utilizan para representar distribuciones de frecuencias para datos agrupados.

132 of 220

CASO PRÁCTICO - HISTOGRAMA

El histograma es la representación gráfica de una situación que debe ser analizada y se somete al formato de gráfico de barras.

133 of 220

COMBINACIÓN HISTOGRAMA�Y POLIGONO DE FRECUENCIA

134 of 220

�POLIGONO DE FRECUENCIAS �VS. OJIVAS

135 of 220

CASO PRÁCTICO - PARETO

136 of 220

EJERCICIO �HISTOGRAMA, POLIGONO DE FRECUENCIAS Y OJIVA EN EXCEL

137 of 220

EJERCICIOS

138 of 220

OJIVA DE FRECUENCIA

Poligono de frecuencias

Son diagramas de línea que se obtienen al unir los puntos medios del lado superior de cada rectángulo del histograma correspondiente. ... Recuerda que el histograma y el polígono de frecuencias son gráficos que se utilizan para representar distribuciones de frecuencias para datos agrupados.

139 of 220

Representación gráfica ojiva

https://www.youtube.com/watch?v=_QsWaS25LTI

140 of 220

REGLA DE STURGES

Ejercicio de aplicación de distribución por intervalos

141 of 220

MEDIDAS DE POSICIÓN

  • Las medidas de posición son indicadores estadísticos que permiten resumir los datos en uno solo, o dividir su distribución en intervalos del mismo tamaño.
  • Las medidas de posición por tanto sirven para medir y para dividir, Su utilización es el primer paso que debe darse en el análisis descriptivo.
  • En el análisis estadístico se utilizan las medidas de posición junto con las de dispersión para agrupar los datos y de esta manera, facilitar la tarea de la del analista.
  • El cuartil, el quintil, el decil y el percentil se categorizan como medidas de posición no central .

142 of 220

REFERENCIACIÓN

Teniendo una línea recta que representa un conjunto de datos:

¿cuántas particiones debería hacer para obtener cuatro grupos en el conjunto?

143 of 220

MEDIDAS DE POSICIÓN

144 of 220

SIGNIFICANCIA ESTADISTICA

145 of 220

GRÁFICOS DE CONTROL

146 of 220

147 of 220

PROBABILIDAD

  1. Experiencia aleatoria. Suceso
  2. Frecuencia y Probabilidad
  3. Ley de La place
  4. Probabilidad condicionada. Sucesos independientes
  5. Pruebas Compuestas
  6. Teorema de probabilidad total

148 of 220

BIBLIOGRAFÍA DE APOYO

149 of 220

QUÉ ES UNA PROBABILIDAD?

Cálculo matemático de las posibilidades que existen de que una cosa se cumpla o suceda al azar.

150 of 220

EXPERIMENTOS

151 of 220

EVENTOS SIMPLES

  • Regla de Laplace

https://www.cisnerosalter.com/wp-content/uploads/2020/05/BACHILLERATO-2-CN2-MATEMATICAS-II-2020-05-07.pdf

152 of 220

CONCEPTOS BÁSICOS

153 of 220

QUÉ PROBABILIDAD HAY DE�SACAR LA BALOTA 5 DE ESTA URNA?

154 of 220

QUÉ HAY DENTRO DE LA URNA?

6

7

5

8

2

3

1

4

155 of 220

TABULACIÓN

IDENTIFICACIÓN

CANTIDAD

Bola con el No. 1

1

Bola con el No. 2

1

Bola con el No. 3

1

Bola con el No. 4

1

Bola con el No. 5

1

Bola con el No. 6

1

Bola con el No. 7

1

Bola con el No. 8

1

156 of 220

TABULACIÓN

IDENTIFICACIÓN

CANTIDAD

Bola con el No. 1

1

Bola con el No. 2

1

Bola con el No. 3

1

Bola con el No. 4

1

Bola con el No. 5

1

Bola con el No. 6

1

Bola con el No. 7

1

Bola con el No. 8

1

Cantidad total de

bolas?

157 of 220

TABULACIÓN

IDENTIFICACIÓN

CANTIDAD

Bola con el No. 1

1

Bola con el No. 2

1

Bola con el No. 3

1

Bola con el No. 4

1

Bola con el No. 5

1

Bola con el No. 6

1

Bola con el No. 7

1

Bola con el No. 8

1

Cantidad de bolas

en la urna?

8

158 of 220

TABULACIÓN

IDENTIFICACIÓN

CANTIDAD

Bola con el No. 1

1

Bola con el No. 2

1

Bola con el No. 3

1

Bola con el No. 4

1

Bola con el No. 5

1

Bola con el No. 6

1

Bola con el No. 7

1

Bola con el No. 8

1

Cantidad de bolas

con el No. 5?

159 of 220

TABULACIÓN

IDENTIFICACIÓN

CANTIDAD

Bola con el No. 1

1

Bola con el No. 2

1

Bola con el No. 3

1

Bola con el No. 4

1

Bola con el No. 5

1

Bola con el No. 6

1

Bola con el No. 7

1

Bola con el No. 8

1

Cantidad de bolas

con el No. 5?

1

160 of 220

TABULACIÓN

IDENTIFICACIÓN

CANTIDAD

Bola con el No. 1

1

Bola con el No. 2

1

Bola con el No. 3

1

Bola con el No. 4

1

Bola con el No. 5

1

Bola con el No. 6

1

Bola con el No. 7

1

Bola con el No. 8

1

Probabilidad

de sacar la bola

con el No. 5?

P(5) = X/X

Esta afirmación es falsa o verdadera?

161 of 220

Qué probabilidad hay de�sacar la balota amarilla de una urna�en donde se introducen las�siguientes balotas?

162 of 220

EJEMPLO: Teniendo

163 of 220

Desocupamos la urna e introducimos nuestras balotas

164 of 220

Qué probabilidad tenemos de sacar la bola roja,

una vez cerramos la urna y le demos un número

indeterminado de giros?

P (R) = ?

165 of 220

FUNDAMENTOS DE PROBABILIDADES

166 of 220

EVENTOS COMPUESTOS

Esta definido porque puede obtener más de un resultado

167 of 220

168 of 220

TEOREMA DE PROBABILIDAD TOTAL

El Teorema de la probabilidad total nos permite calcular la probabilidad de un suceso a partir de probabilidades condicionadas: ... Los sucesos A tienen que formar un sistema completo, es decir, que contemplen todas las posibilidades (la suma de sus probabilidades debe ser el 100%).

https://www.youtube.com/watch?v=XLVJshAjiYw

169 of 220

EJERCICIOS

Teorema probabilidad total

  • Tenemos tres cajas, la primera contiene 10 bombillos, la segunda 6 bombillos y la tercera 8 bombillos.
  • ¿Cuál es la probabilidad de que al sacar un bombillo al azar de cualquiera de las cajas el bombillo este fundido?
  • Teniendo en cuenta que:

En la primera caja hay 4 bombillas fundidas, en la segunda hay 5 bombillas buenas mientras que la tercera caja tiene un 62,5% de bombillas buenas.

170 of 220

NOMENCLATURA

  • Evento: X
  • Bombilla buena: B
  • Bombilla fundida: F
  • Probabilidad del suceso: P(x)
  • Sucesos incompatibles: A1, A2, A3
  • A1U A2U A3 = E

171 of 220

EJERCICIOS

  • Teorema probabilidad total
  • Se construye el diagrama de árbol

B:?

Caja uno = 1/3

F: 4/10

B: 5/6

Cajas Caja dos = 1/3

F:?

B: 62,5%

Caja tres = 1/3 Si 8/8=100% entonces ? = 62,5%

F:?

172 of 220

EJERCICIOS

  • Teorema probabilidad total
  • Se construye el diagrama de árbol

B:6/10

Caja uno = 1/3

F: 4/10

B: 5/6

Cajas Caja dos = 1/3

F:1/6

B: 5/8

Caja tres = 1/3

F: 3/8

173 of 220

FORMULACIÓN

  • Evento: X
  • Bombilla buena: B
  • Bombilla fundida: F
  • Probabilidad del suceso: P(x)
  • Sucesos incompatibles: A1, A2, A3
  • A1U A2U A3 = E

P(x) = P(A1) . P(X/ A1 ) + P(A2) . P(X/ A2 ) + P(A3) . P(X/ A3 )

174 of 220

FORMULACIÓN

P(x) = P(A1) . P(X/ A1 ) + P(A2) . P(X/ A2 ) + P(A3) . P(X/ A3 )

P(x) = (1/3) . (4/10) + (1/3) . (1/6 ) + (1/3) . (3/8)

P(x) = ?

175 of 220

FORMULACIÓN

P(x) = P(A1) . P(X/ A1 ) + P(A2) . P(X/ A2 ) + P(A3) . P(X/ A3 )

P(x) = (1/3) . (4/10) + (1/3) . (1/6 ) + (1/3) . (3/8)

P(x) = 31,4% la probabilidad de sacar una bombilla fundida, al sacar al azar una bombilla de una de las tres cajas que se tienen.

176 of 220

EJERCICIOS RESUELTOS TEOREMA DE LA PROBABILIDAD TOTAL

177 of 220

TEOREMA DE BAYES

El teorema de Bayes es utilizado para calcular la probabilidad de un suceso, teniendo información de antemano sobre ese suceso.

Tiene en cuenta la información que conocemos que se ha producido en determinado entorno con determinados factores para saber cuáles de esos factores han producido esas consecuencias

Su utilidad se ha demostrado, a diferencia de la estimación estadística tradicional, como un modo de variar nuestras expectativas según la experiencia concreta que tenemos sobre algo, lo que tiene mucha utilidad en diversos campos, desde la medicina, el juego de azar y hasta el tratamiento informático de datos.

178 of 220

TEOREMA DE BAYES

  •  

aposteriori

total

condicional

apriori

Se define como la probabilidad de explicar un hecho

a partir de la verificación de un suceso qué ha ocurrido con antelación .

179 of 220

SÍNTESIS

180 of 220

EJERCICIO 1

Una empresa tiene una fábrica en Estados Unidos que dispone de tres máquinas A, B y C, que producen envases para botellas de agua. Se sabe que la máquina A produce un 40% de la cantidad total, la máquina B un 30%, y la máquina C un 30%. También se sabe que cada máquina produce envases defectuosos. De tal manera que la máquina A produce un 2% de envases defectuosos sobre el total de su producción, la máquina B un 3%, y la máquina C un 5%. Dicho esto, se plantean dos cuestiones:

  • P(A) = 0,40 P(D/A) = 0,02
  • P(B) = 0,30 P(D/B) = 0,03
  • P(C) = 0,30 P(D/C) = 0,05

181 of 220

DIAGRAMA DE ÁRBOL

Máquina B

Máquina C

Máquina A

Producción total

182 of 220

Máquina B

Máquina C

Máquina A

Producción total

D

 

D

 

D

 

183 of 220

Máquina B

Máquina C

Máquina A

Producción total

D

 

D

 

D

 

0,3

0,3

0,4

184 of 220

P(B) = 0,3

P(C)= 0,3

P (A)= 0,4

Producción total

D

 

D

 

D

 

 

 

 

185 of 220

P(B) = 0,3

P(C)= 0,3

P (A)= 0,4

Producción total

D

 

D

 

D

 

 

 

 

 

 

 

+

186 of 220

P(B) = 0,3

P(C)= 0,3

P (A)= 0,4

Producción total

D

 

D

 

D

 

 

 

 

 

 

 

+

= 1

= 1

= 1

187 of 220

  1. Si un envase ha sido fabricado por la fábrica de esta empresa en Estados Unidos ¿Cuál es la probabilidad de que sea defectuoso?
  2. Se calcula la probabilidad total. Ya que, a partir los diferentes sucesos, calculamos la probabilidad de que sea defectuoso.
  3. P(D) =[ P(A) x P(D/A) ] + [ P(B) x P(D/B) ] + [ P(C) x P(D/C) ] = [ 0,4 x 0,02 ] + [ 0,3 x 0,03 ] + [ 0,3 x 0,05 ] = 0,032
  4. Expresado en porcentaje, diríamos que la probabilidad de que un envase fabricado por la fábrica de esta empresa en Estados Unidos sea defectuoso es del 3,2%.

188 of 220

P(B) = 0,3

P(C)= 0,3

P (A)= 0,4

Producción total

D

 

D

 

D

 

 

 

 

 

 

 

X

189 of 220

P(B) = 0,3

P(C)= 0,3

P (A)= 0,4

Producción total

D

 

D

 

D

 

 

 

 

 

 

 

X

¿Cuál es la probabilidad

de que sea defectuoso

Si fue fabricado en la máquina A?

190 of 220

P(B) = 0,3

P(C)= 0,3

P (A)= 0,4

Producción total

D

 

D

 

D

 

 

 

 

 

 

 

X

¿Cuál es la probabilidad

de que sea defectuoso

Si fue fabricado en la máquina A?

191 of 220

P(B) = 0,3

P(C)= 0,3

P (A)= 0,4

Producción total

D

 

D

 

D

 

 

 

 

 

 

 

X

¿Cuál es la probabilidad

de que sea defectuoso

Si fue fabricado en la máquina B?

192 of 220

P(B) = 0,3

P(C)= 0,3

P (A)= 0,4

Producción total

D

 

D

 

D

 

 

 

 

 

 

 

X

¿Cuál es la probabilidad

de que sea defectuoso

Si fue fabricado en la máquina C?

193 of 220

  • 2. Siguiendo con la pregunta anterior, si se adquiere un envase y este es defectuoso ¿Cuáles es la probabilidad de que haya sido fabricado por la máquina A? ¿Y por la máquina B? ¿Y por la máquina C?
  • Aquí se utiliza el teorema de Bayes. Tenemos información previa, es decir, sabemos que el envase es defectuoso. Claro que, sabiendo que es defectuoso, queremos saber cuál es la probabilidad de que se haya producido por una de las máquinas.
  • P(A/D) = [P(A) x P(D/A)] / P(D) = [0,40 x 0,02] / 0,032 = 0,25
  • P(B/D) = [P(B) x P(D/B)] / P(D) = [0,30 x 0,03] / 0,032 = 0,28
  • P(C/D) = [P(C) x P(D/C)] / P(D) = [0,30 x 0,05] / 0,032 = 0,47
  • Sabiendo que un envase es defectuoso, la probabilidad de que haya sido producido por la máquina A es del 25%, de que haya sido producido por la máquina B es del 28% y de que haya sido producido por la máquina C es del 47%.

194 of 220

EJERCICIOS

195 of 220

MISCELANEA

196 of 220

TEST

Ejercicio 1.

Una moneda tiene en sus caras un gato y un perro.

Si se lanza 3 veces la moneda,

a) ¿Cuál es la posibilidad de obtener 3 perros?

b) ¿Cuál es la posibilidad de tener solamente un perro?

P(x) : Posibilidad de que salga perro P(Y) : Posibilidad de que salga gato

X: perro Y: gato

197 of 220

NUMERAL A)

Posibilidad de obtener como resultado tres perros después de realizar tres lanzamientos.

198 of 220

gato

perro

gato

perro

gato

perro

gato

perro

gato

perro

gato

perro

gato

perro

0,5

0,5

0,5

0,5

0,5

0,5

0,5

0,5

0,5

0,5

0,5

0,5

0,5

0,5

Diagrama de árbol

Lanzamiento 2

Lanzamiento 3

Lanzamiento 1

P(Y) = ½ = 0,5

P(X) = ½ = 0,5

P (L) =

P(L)=P(X)+P(Y)

199 of 220

gato

perro

gato

perro

gato

perro

gato

perro

gato

perro

gato

perro

gato

perro

0,5

0,5

0,5

0,5

0,5

0,5

0,5

0,5

0,5

0,5

0,5

0,5

0,5

0,5

Lanzamiento 2

Lanzamiento 3

Lanzamiento 1

P(Y) = ½ = 0,5

P(X) = ½ = 0,5

P (L) =

P(L)=P(X)+P(Y)

Ruta para que en los tres lanzamientos se obtengan tres perros:

200 of 220

SOLUCIÓN MATEMÁTICA:

  • Para lograr la trayectoria de la ruta que nos interesa debemos desplazar el trazo en sentido horizontal dentro del diagrama de árbol, por lo tanto:

P(Z): Probabilidad de obtener en los tres lanzamientos tres perros

Para la ruta única o universal se verifica que:

P(Z) = P(X)1 * P(X)2 * P(X)3 = (0,5) (0,5) (0.5) = 0,125

Multiplicamos por 100 para obtener la respuesta en porcentaje

P(Z) = 0,125 * 100 = 12.5%

RTA/ EXISTE UNA PROBABILIDAD DEL 12,5% DE QUE EN LOS TRES LANZAMIENTOS

SE OBTENGAN COMO RESULTADO TRES PERROS EN UNA DE LAS CARAS DE LA MONEDA.

Nota: Se debe considerar que como solo hay dos alternativas de resultado en cada lanzamiento

Entonces un resultado excluye la otra posibilidad y así se obtiene sólo una ruta posible..

201 of 220

NUMERAL B)

Posibilidad de obtener como resultado un solo perro después de realizar tres lanzamientos.

202 of 220

gato

perro

gato

perro

gato

perro

gato

perro

gato

perro

gato

perro

gato

perro

0,5

0,5

0,5

0,5

0,5

0,5

0,5

0,5

0,5

0,5

0,5

0,5

0,5

0,5

Diagrama de árbol

Lanzamiento 2

Lanzamiento 3

Lanzamiento 1

P(Y) = ½ = 0,5

P(X) = ½ = 0,5

P (L) =

P(L)=P(X)+P(Y)

203 of 220

gato

perro

gato

perro

gato

perro

gato

perro

gato

perro

gato

perro

gato

perro

0,5

0,5

0,5

0,5

0,5

0,5

0,5

0,5

0,5

0,5

0,5

0,5

0,5

0,5

Ruta 1 para que en los tres lanzamientos solo se obtenga un perro:

Lanzamiento 2

Lanzamiento 3

Lanzamiento 1

P(Y) = ½ = 0,5

P(X) = ½ = 0,5

P (L) =

P(L)=P(X)+P(Y)

204 of 220

gato

perro

gato

perro

gato

perro

gato

perro

gato

perro

gato

perro

gato

perro

0,5

0,5

0,5

0,5

0,5

0,5

0,5

0,5

0,5

0,5

0,5

0,5

0,5

0,5

Diagrama de árbol

Lanzamiento 2

Lanzamiento 3

Lanzamiento 1

P(Y) = ½ = 0,5

P(X) = ½ = 0,5

P (L) =

P(L)=P(X)+P(Y)

205 of 220

gato

perro

gato

perro

gato

perro

gato

perro

gato

perro

gato

perro

gato

perro

0,5

0,5

0,5

0,5

0,5

0,5

0,5

0,5

0,5

0,5

0,5

0,5

0,5

0,5

Lanzamiento 2

Lanzamiento 3

Lanzamiento 1

P(Y) = ½ = 0,5

P(X) = ½ = 0,5

P (L) =

P(L)=P(X)+P(Y)

Ruta 3 para que en los tres lanzamientos solo se obtenga un perro:

206 of 220

SOLUCIÓN MATEMÁTICA:

  • Para cada una de las rutas nos debemos desplazar en sentido horizontal dentro del diagrama de árbol, por lo tanto:

P(Z): Probabilidad de obtener en los tres lanzamientos solamente un perro

Para la ruta 1.

P(Z) = P(X)1 * P(Y)2 * P(Y)3 = (0,5) (0,5) (0.5) = 0,125

Multiplicamos por 100 para obtener la respuesta en porcentaje

P(Z) = 0,125 * 100 = 12.5%

RTA/ EXISTE UNA PROBABILIDAD DEL 12,5% DE QUE EN LOS TRES LANZAMIENTOS

SE OBTENGA COMO RESULTADO UN PERRO EN UNA DE LAS CARAS DE LA MONEDA.

207 of 220

SOLUCIÓN MATEMÁTICA:

  • Para cada una de las rutas nos debemos desplazar en sentido horizontal dentro del diagrama de árbol, por lo tanto:

P(Z): Probabilidad de obtener en los tres lanzamientos solamente un perro

Para la ruta 2.

P(Z) = P(Y)1 * P(X)2 * P(Y)3 = (0,5) (0,5) (0.5) = 0,125

Multiplicamos por 100 para obtener la respuesta en porcentaje

P(Z) = 0,125 * 100 = 12.5%

RTA/ EXISTE UNA PROBABILIDAD DEL 12,5% DE QUE EN LOS TRES LANZAMIENTOS

SE OBTENGA COMO RESULTADO UN PERRO EN UNA DE LAS CARAS DE LA MONEDA.

208 of 220

SOLUCIÓN MATEMÁTICA:

  • Para cada una de las rutas nos debemos desplazar en sentido horizontal dentro del diagrama de árbol, por lo tanto:

P(Z): Probabilidad de obtener en los tres lanzamientos solamente un perro

Para la ruta 3.

P(Z) = P(Y)1 * P(Y)2 * P(Z)3 = (0,5) (0,5) (0.5) = 0,125

Multiplicamos por 100 para obtener la respuesta en porcentaje

P(Z) = 0,125 * 100 = 12.5%

RTA/ EXISTE UNA PROBABILIDAD DEL 12,5% DE QUE EN LOS TRES LANZAMIENTOS

SE OBTENGA COMO RESULTADO UN PERRO EN UNA DE LAS CARAS DE LA MONEDA.

209 of 220

SOLUCIÓN MATEMÁTICA:

Notas aclaratorias:

Se deben verificar los tres lanzamientos de acuerdo a la condición del ejercicio

para analizar la situación como un solo conjunto.

Se cumple la misma probabilidad del 12,5% en cada una de las tres rutas,

por cuanto la distribución de probabilidad de resultado es simétrica en cada una

de las ramas.

210 of 220

211 of 220

DISTRIBUCIÓN BINOMIAL

212 of 220

DISTRIBUCIÓN HIPERGEOMETRICA

213 of 220

214 of 220

DISTRIBUCION NORMAL

215 of 220

EJERCICIO DE DISTRIBUCIÓN DE PROBABILIDAD

Tenemos dos dados. Vamos a verificar el espacio muestral de resultados obtenidos al lanzarlos.

  1. ¿Estamos trabajando con variables continuas o variables discretas?
  2. Determine alternativas de resultado, construya gráfico y determine el modelo de distribución que se debe aplicar.

216 of 220

217 of 220

DISTRIBUCION NORMAL

218 of 220

DISTRIBUCIÓN NORMAL

219 of 220

DISTRIBUCIÓN DE POISSON

220 of 220