La estadística descriptiva, que se dedica a los métodos de recolección, descripción, visualización y resumen de datos originados a partir de los fenómenos en estudio. Los datos pueden ser resumidos numérica o gráficamente. Ejemplos básicos de parámetros estadísticos son: la media y la desviación estándar. Algunos ejemplos gráficos son: histograma, pirámide poblacional, clústers, etc.

Que es la Estadística:

Es una ciencia con base matemática referente a la recolección, análisis e interpretación de datos, que busca explicar condiciones regulares en fenómenos de tipo aleatorio.

La estadística se divide en dos ramas:


La estadística inferencial, que se dedica a la generación de los modelos, inferencias y predicciones asociadas a los fenómenos en cuestión teniendo en cuenta la aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la población bajo estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas si/no (prueba de hipótesis), estimaciones de características numéricas (estimación), pronósticos de futuras observaciones, descripciones de asociación (correlación) o modelamiento de relaciones entre variables (análisis de regresión). Otras técnicas de modelamiento incluyen ANOVA, series de tiempo y minería de datos.

Población:

Representa el conjunto de todos los individuos que deseamos estudiar y generalmente suele ser inaccesible. Tienen en común alguna característica observable y del que se pretende obtener una serie de conclusiones.

Parámetros:

Se llamará parámetro a una característica medible de la población. Por ejemplo, la edad promedio de los estudiantes, el porcentaje de varones; el diámetro promedio de los tornillos que se producen en una fábrica, la tasa de crecimiento promedio de la tilapia roja, el tiempo promedio entre fallas de una maquina etc. Un parámetro es una característica numérica constante de la población, se identifica con letras griegas (Media: µ, Desviación estándar: σ, Proporción: π, Coeficiente de correlación: ρ)

Muestra:

Es el conjunto menor de individuos accesible y limitado de la población sobre el que realizamos las mediciones o el experimento con la idea de obtener conclusiones generalizables a la población. El individuo es cada uno de los componentes de la población y la muestra. Al número de individuos que forman la muestra se llama tamaño muestral (n). La muestra debe ser representativa de la población y con ello queremos decir que cualquier individuo de la población en estudio debe haber tenido la misma probabilidad de ser elegido.

Las razones para estudiar muestras en lugar de poblaciones son diversas y entre ellas podemos señalar:
  •  Ahorrar tiempo.
  •  Ahorrar costes.
  •  Estudiar la totalidad de los pacientes o personas con una característica determinada en muchas ocasiones puede ser una tarea inaccesible o imposible de realizar.
  •  Aumentar la calidad del estudio

Variables:


Lo que estudiamos en cada individuo de la muestra son las variables (edad, sexo, peso, talla, tensión arterial sistólica, etc.) Los datos son los valores que toma la variable en cada caso. Lo que vamos a realizar es medir, es decir, asignar valores a las variables incluidas en el estudio. Deberemos además concretar la escala de medida que aplicaremos a cada variable.

a) Variables cuantitativas: Son las variables que pueden medirse, cuantificarse o expresarse numéricamente. Las variables cuantitativas pueden ser de dos tipos:

  •  Variables cuantitativas continuas, si admiten tomar cualquier valor dentro de un rango numérico determinado (edad, peso, talla).
  •  Variables cuantitativas discretas, si no admiten todos los valores intermedios en un rango. Suelen tomar solamente valores enteros (número de hijos, número de partos, numero de hermanos, etc.)

b) Variables cualitativas: Este tipo de variables representan una cualidad o atributo que clasifica a cada caso en una de varias categorías.
  1.  Dicotómicas (escalas nominales): La situación más sencilla es aquella en la que se clasifica cada caso en uno de dos grupos (hombre/ mujer, enfermo/sano, fumador/ no fumador).
  2.  Ordinal (escalas ordinales): Se requiere de un mayor número de categorías (color de los ojos, grupo sanguíneo, profesión, etc.)

Escalas de medición:

Cuando se hace referencia a las escalas se trata de asociar números a las características con el propósito de manipularlas y obtener nuevo conocimiento sobre las características del estudio. Se consideran generalmente cuatro escalas de medición: escala nominal, escala ordinal, escala de intervalo y escala de razón

La escala nominal, hace uso de los números para dar nombres a los elementos que han sido clasificados en distintos grupos, clases o categorías de acuerdo con alguna propiedad cualitativa. El número asignado a una clase sólo actúa como un rótulo o código para diferenciar los elementos de esa clase con los de otra. Por ejemplo, si se clasifica un conjunto de objetos por su color, las categorías pueden ser: azul, amarillo, rojo, verde, a las cuales podemos asociar respectivamente los números 1,2,3,4 y se hablará de la categoría 1 para hacer referencia al grupo de objetos de color azul o 4 para el verde, pero los números aquí, solo son códigos para nombrar los elementos de una clase.

La escala ordinal, hace uso de los números para clasificar los elementos de un conjunto en categorías en los cuales los números no solo sirven para nombrar, sino que son base para comparaciones de la forma: ¨más grande¨, ¨igual¨, ¨menor¨, es decir, que el valor numérico de la medida se usa para indicar el orden que ocupa un elemento al comparar el tamaño relativo de sus medidas, del más grande al más pequeño, de allí el nombre de escala. Un ejemplo, cuando a una persona se le pide ordenar de las más importantes a la menos importantes, asignando números de 1 a 4, a las siguientes necesidades: empleo, salud, vivienda, servicios públicos. Aquí el número se usa para representar la prioridad de las necesidades; de esta manera si un individuo asigna el número 1 a la vivienda y el 4 al empleo, indicará que para él es ¨más importante¨ la vivienda que el empleo.

La escala de intervalo, considera pertinente información no sólo sobre el orden relativo de las necesidades, como en la escala ordinal, sino también del tamaño del intervalo entre mediciones, esto es, el tamaño de la diferencia (resta) entre dos medidas. La escala de intervalo involucra el concepto de una unidad de distancia. Por ejemplo, la escala con la cual casualmente representamos la temperatura; un incremento en una unidad (grado) de la temperatura está definido por cambio particular en el volumen de mercurio en el interior del termómetro, de esta manera, la diferencia entre dos temperaturas puede ser medida en unidades (grados). El valor numérico de una temperatura es meramente una comparación con un punto arbitrario llamado ¨cero grados¨. La escala de intervalo requiere un punto cero, como también, una unidad de distancia, pero no importa cual punto se define como cero ni cual unidad es la unidad de distancia. La temperatura ha sido medida adecuadamente por mucho tiempo en las escalas Fahrenheit y centígrada, las cuales tienen diferente temperatura cero y diferentes definiciones de 1 grado o unidad. El principio de la medida de intervalo no es violado por cambios en la escala o en la localización.

La escala de razón, es usada cuando no solamente el orden y el tamaño del intervalo ente medidas son importantes, sino también la razón (o cociente) entre dos medidas. Si es razonable hablar de que una cantidad es ¨dos veces¨ otra cantidad, entonces la escala de razón es apropiada para la medición, como cuando medimos distancias, pesos, alturas, etc. Realmente la única diferencia entre la escala de razón y la escala de intervalo, es que la escala de razón tiene un punto cero natural, mientras que en la escala de intervalo éste es arbitrario. En ambas escalas la unidad de distancia es arbitrariamente definida.


Para variables categóricas, como el sexo, se quiere conocer el número de casos encada una de las categorías, reflejando habitualmente el porcentaje que representan del total, y expresándolo en una tabla de frecuencias.

Para variables numéricas, en las que puede haber un gran número de valores observados distintos, se ha de optar por un método de análisis distinto, respondiendo a las siguientes preguntas:
  1.  ¿Alrededor de qué valor se agrupan los datos? Se da respuesta a esta pregunta con las medidas de tendencia central.
  2. Supuesto que se agrupan alrededor de un número, ¿Cómo lo hacen? ¿Muy concentrados? ¿Muy dispersos? Se da respuesta a esta pregunta con las medidas de dispersión.
Distribución de frecuencias.

Distribución de frecuencias. 


La distribución de frecuencias o tablas de frecuencias es una ordenación en forma de tabla de los datos estadísticos, asignado a cada dato su frecuencia correspondiente.

  •  La frecuencia absoluta es el número de veces que aparece un determinado valor en un estudio estadístico. Denotada por \(f_{i}\)
  • La frecuencia relativa es el cociente entre la frecuencia  absoluta de un determinado valor y el número total de datos. Denotado por \(f_{ri}\)
\(f_{ri}= \frac{f_{i}}{n} \)
  • La frecuencia absoluta acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado. Denotado por \(F_{i}\)
\(F_{i}=\sum_{i=1}^{k}{f_{i}}\)
  • La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado valor y el número total de datos. Se puede expresar en tantos por ciento. Denotado por \(F_{ri}\)
\(F_{ri}= \frac{\sum_{i=1}^{k}{f_{i}} }{n}\)

O también \(F_{ri}= \sum_{i=1}^{k}{f_{ri}}\)

  • La marca de clases es el punto medio de la clase, es decir, el promedio del límite inferior y el límite superior 
\(mi=\frac{Linf+Lsup}{2}\)
Números de clases y amplitud

Es necesario cuando se estudia una muestra grande agrupar los datos en clases. Para determinar el número de clases y amplitud se plantea lo siguiente

  1. Se conoce previamente el número de clases, denotado por k que se requieren en la distribución de frecuencias. Dividiendo el rango R entre el número de clases K se obtiene la amplitud aproximada de las clases (denotada por c), así asumiremos la misma amplitud para todas las clases. Esto es  

\(R / k=c\)

  1. También se puede presentar que no sabremos cuantas clases formar, pero si la amplitud de las mismas. Entonces al dividir el rango R sobre la amplitud de las clases c se obtiene el número aproximado de clases (todas con la misma amplitud). Esto es 

\(R / c=k\)

  1. En la práctica por lo general no se conocen previamente el número de clases ni la amplitud. Entonces surge la Regla de Sturges, que proporciona una idea de cuál debe ser la amplitud de las clases. Viene dada por 

\(k=1+3,3log(n)\)

Donde k es el número de clases, n el número total de datos y log el logaritmo en base 10 

Medidas de tendencia:

Medidas de tendencia central:

            Las medidas de centralización vienen a responder a la primera pregunta. Nos indican alrededor de que valores se agrupan los datos observados. Distinguimos:

1. Media: Es la suma de todos los valores de una variable dividida entre el número total de datos de los que se dispone.  

  •  Para datos no agrupados: 

\(\bar{X}=\sum_{i=1}^{k}{f_i}*mi /n\)

  • Para datos agrupados:

\(\bar{X}=\sum_{i=1}^{n}{X_i} / n\)   

 2. Mediana: Es el valor numérico que divide al conjunto de datos ordenados en 2 partes iguales, es decir, el 50% de los datos será menor que ella y el 50% de los datos mayor. En una distribución simétrica, la mediana coincide con la media aritmética, pero no en una asimétrica. Es la observación equidistante de los extremos

  • Para datos no agrupados:Se ordenan los datos en forma creciente. La mediana es el valor en la posición n/2. 
  • Para datos agrupados: 

\(Md=L_inf+(n/2-F_ant / f_m)*c\)

Donde: 

  • Linf: Límite inferior de la medianal.
  • Fant: Frecuencia absoluta acumulada anterior a la clase medianal.
  • fm: Frecuencia absoluta de la clase medianal.
  • c: Amplitud de la clase medianal 
  • n: Número total de observaciones. 
  • Clase medianal: Es la clase que contiene el valor central n/2 en la frecuencia absoluta acumulada. 

 3. Moda: Siendo éste el valor de la variable que presenta una mayor frecuencia. Pueden existir distribuciones con más de una moda.  

  • Datos no agrupados: Se ordenan los datos de forma creciente y se identifica el valor con más frecuencia.
  • Datos agrupados: 

\(moda= L_{inf}+(D_1 / D_1+D_2)*c\)

Donde: 

  • Linf: Límite inferior de la clase modal.
  • \(D_1\): Es la diferencia entre la frecuencia de la clase modal y la clase que antecede. 
  • \(D_2\): Es la diferencia entre la frecuencia de la clase modal y la clase que le sigue. 
  • c: Es la amplitud de la clase. 
  • La clase modal es aquella clase que posea la mayor frecuencia absoluta. 

Medidas de dispersión: 

Tal y como se adelantaba antes, otro aspecto a tener en cuenta al describir datos continuos es la dispersión de los mismos. Éstas complementan la información sobre la distribución de la variable, indicando si los valores de la variable están muy dispersos o se concentran alrededor de la medida de centralización

1.Rango o recorrido: Cuando se quieren señalar valores extremos en una distribución de datos, se suele utilizar la amplitud como medida de dispersión. La amplitud es la diferencia entre el valor mayor y el menor de la distribución. 

\(R= Max-min\)

2. Varianza( \({S}^2\)): Es la media de los cuadrados de las diferencias entre cada valor de la variable y la media aritmética de la distribución. Debido a que los datos provienen de una muestra, el denominador es n-1.

  • Datos no agrupados: 

\({S}^2=\sum{(X_i - \overline{X})^2}/ n-1\)

  • Datos agrupados:

\({S}^2=\sum{(X_i - \overline{X})^2}*f_i/ n-1\)

Que es equivalente a \({S}^2=\sum mi^2fi-n\bar{X}^2/ n-1\)

Esta varianza muestral se obtiene como la suma de las diferencias de cuadrados y, por tanto, tiene como unidades de medida el cuadrado de las unidades en que se mide la variable estudiada.

3. Desviación típica (S): Es la raíz cuadrada de la varianza. Expresa la dispersión de la distribución y se expresa en las mismas unidades de medida de la variable. La desviación típica es la medida de dispersión más utilizada en la estadística. 

\(S=\sqrt{S^2}\)

Ejemplo 1. Para datos no agrupados.  

Las edades en años de un grupo de nueve pesonas son: 20,22,26,21,25,24,25,21,21

La muestra es pequeña,no es necesario hacer una tabla distribución de frecuencias. Se hallarán solo las medidas de tendencia central y de dispersión. 

1. Medidas de tendencia central:

a) Media: 

\(\bar{X}=\sum_{i=1}^{n}{X_i}/ n\) 

\(\bar{X}= \frac{20+22+26+21+25+24+25+21+21}{9}=22,77\)

El valor promedio de los datos es 22,77 años

b) Mediana: 

Se ordenan los datos de forma creciente, la mediana es el valor central: 20,21,21,21,22,24,25,25,26. El valor central es 22. Por lo tanto Mediana=22. 

c) Moda:

Es el valor con más frecuencias. Moda= 21 debido a que esta presente en tres ocasiones. 

2. Medidas de dispersión: 

a)  Rango: 

\(R=26-20=6\)

La diferencia entre la mayor edad y la menor edad es de 6. 

b) Varianza: 

\({S}^2=\sum{(X_i - \overline{X})^2}/ n-1\)

\(S^2=\frac{(20-22,77)^2 +(21-22,77)^2+...+(26-22,77)^2}{9-1}=4,94\)

c) Desviación estándar:

\(S=\sqrt{S^2}\)

\(S=\sqrt{4,94}=2,22\)

d)  Histograma: Se grafica mediante barras las observaciones en el eje x y las frecuecias en el eje y. Es evidente que las edades 21 y 25 tienen más frecuencias que las demás. Donde la máxima es 21 con 3 obsrvaciones. 

histograma

Ejemplo 2. Para datos agrupados 

La siguiente información corresponde al nivel de hemoglobina de un grupo de 40 pacientes de un hospital. 

12 14,8 13,7 13,8 16 15 14 17,2
16,2 15,3 11,6 15,2 16,2 16,2 14,8 16
14,6 15,4 15,7 17,3 18 16 15 15
14 13,2 14,8 17 16,3 13,6 16,9 16,2
14,6 14,4 15 14,8 14,7 15,3 15,4 16,8

Nivel de hemoglobina, gr./100ml de 40 pacientes de un hospital

 

El primer paso para construir la tabla de frecuencia es ordenar los datos de menor a mayor. 

11,6 12 13,2 13,6 13,7 13,8 14 14
14,4 14,6 14,6 14,7 14,8 14,8 14,8 14,8
15 15 15 15 15,3 15,3 15,3 15,4
15,4 15,7 16 16 16,2 16,2 16,2 16,2
16,2 16,3 16,8 16,9 17,2 17,3 17,3 18

Para determinar la amplitud y número de clases existen varios posibles casos. 

1. En el caso que en el ejercicio de la hemoglobina quisiéramos 7 clases.

El rango en estudio es \(R=L_{max}-L_{min}=18-11,6=6,4\)

La amplitud viene por \(\frac{6,4}{7}=0,91\cong 1\)

2.Si quisiéramos amplitud de 1,2 gr/100ml tendríamos el número de clases

 \(\frac{6,4}{1,2}=5,3\)

Formando alrededor de 5 a 6 clases. 

3. Usando la fórmula  Sturges se forman 6 clases

\(k=1+3,3log(40)=6,28\)

Tomando como referencia el primer caso, con 7 clases y amplitud igual a 1. Procedemos a construir los intervalos de clases. Se fija el límite inferior que es el valor mínimo y se le suma la amplitud c obteniendo el limite superior de la primera clase, el cual va a coincidir con el limite inferior de la segunda clase que se le suma la amplitud c y se obtiene el límite superior de la segunda clase. Reiterando el procedimiento hasta que se determine todas las clases. 

[11,6-11,6+1) 

[12,6-12,6+1)

Hasta obtener los 7 intervalos 

[11,6-12,6)

[12,6-13,6)

[13,6-14,6)

[14,6-15,6)

[15,6-16,6)

[16,6-17,6)

[17,6-18,6) 

Luego se crea la tabla de distribución de frecuencias. Empezando con la frecuencia absoluta que es el conteo de las observaciones presentes en cada intervalo 

Clase o Intervalo Frecuencia absoluta(fi)
[11,6-12,6) 2
[12,6-13,6) 1
[13,6-14,6) 6
[14,6-15,6) 16
[15,6-16,6) 9
[16,6-17,6) 5
[17,6-18,6) 1

Ahora es necesario obtener los elementos relacionados a una distribución de frecuencias. 

Clase o intervalo Frecuencia absoluta fi Frecuencia relativa fri Frecuencia acumulada absoluta Fi Frecuencia acumulada Fri Marca de clase mi
[11,6-12,6) 2 0,05 2 0,05 12,1
[12,6-13,6) 1 0,025 3 0,075 13,1
[13,6-14,6) 6 0,15 9 0,225 14,1
[14,6-15,6) 16 0,4 25 0,625 15,1
[15,6-16,6) 9 0,225 34 0,85 16,1
[16,6-17,6) 5 0,125 39 0,975 17,1
[17,6-18,6) 1 0,025 40 1 18,1

 Histograma

Mediante el grafico identificamos que la mayoría de los pacientes en la muestra presentan nivel de hemoglobina entre 13,6 y 17,6 gr/ 100 ml 

1. Medidas de tendencia central. 

1.1. Media 

\(\bar{X}=\sum_{i=1}^{n}{X_i} / n\)   

Se halla el producto de fi*mi en una tabla, luego se suma para sustituirlo en la formula de la media.

Clase o intervalo Frecuencia absoluta fi Marca de clase mi fi*mi
[11,6-12,6) 2 12,1 24,2
[12,6-13,6) 1 13,1 13,1
[13,6-14,6) 6 14,1 84,6
[14,6-15,6) 16 15,1 241,6
[15,6-16,6) 9 16,1 144,9
[16,6-17,6) 5 17,1 85,5
[17,6-18,6) 1 18,1 18,1
      Suma:612

Sustituyendo en la fórmula 

\bar{X}=\frac{612}{40}=15,3

1.2. Mediana 

\(Md=L_inf+(n/2-F_ant / f_m)*c\)

Donde:

 

  • Linf: Límite inferior de la medianal.
  • Fant: Frecuencia absoluta acumulada anterior a la clase medianal.
  • fm: Frecuencia absoluta de la clase medianal.
  • c: Amplitud de la clase medianal 
  • n: Número total de observaciones. 
  • Clase medianal: Es la clase que contiene el valor central n/2 en la frecuencia absoluta acumulada
Clase o intervalo Frecuencia absoluta fi Frecuencia absoluta acumulada Fri
[11,6-12,6) 2 2
[12,6-13,6) 1 3
[13,6-14,6) 6 9
[14,6-15,6) 16 25
[15,6-16,6) 9 34
[16,6-17,6) 5 39
[17,6-18,6) 1 40

Identificar la clase medianal. 

Aquí el n=40 así que 40/2= 20 la clase que lo contiene es [14,6-15,6). Una vez identificada sustituimos en la formula 

\(Md=14,6+\frac{20-9}{16}*1=15,2875\)

1.3.Moda 

\(moda=L_{inf}+\frac{D_1}{D_1*D_2}*c\)

Donde: 

  • Linf: Límite inferior de la clase modal.
  • \(D_1\): Es la diferencia entre la frecuencia de la clase modal y la clase que antecede. 
  • \(D_2\): Es la diferencia entre la frecuencia de la clase modal y la clase que le sigue. 
  • c: Es la amplitud de la clase. 
  • La clase modal es aquella clase que posea la mayor frecuencia absoluta. 
Clase o intervalo Frecuencia absoluta fi Frecuencia acumulada absoluta Fi
[11,6-12,6) 2 2
[12,6-13,6) 1 3
[13,6-14,6) 6 9
[14,6-15,6) 16 25
[15,6-16,6) 9 34
[16,6-17,6) 5 39
[17,6-18,6) 1 40

Es la clase de [14,6-15,6) porque la frecuencia es de 16. Ahora sustituimos los datos en la formula. 

\(Moda=14,6+\frac{16-6}{(16-6)+(16-9)}*1\)

\(Moda=14,6+\frac{10}{10+7}=15,18\)

2. Medidas de dispersión. 

2.1. Rango 

\(R=L_{max}-L_{min}=18-11,6=6,4\)

2.2. Varianza 

\({S}^2=\sum{(X_i - \overline{X})^2}f_i/ n-1\)

Que es equivalente a \({S}^2=\sum mi^2fi-n\bar{X}^2/ n-1\)

Mediante la tabla. 

Clase o intervalo Frecuencia absoluta fi Marca de clase mi \(mi^2fi\)
[11,6-12,6) 2 12,1 292,82
[12,6-13,6) 1 13,1 171,61
[13,6-14,6) 6 14,1 1192,86
[14,6-15,6) 16 15,1 3648,16
[15,6-16,6) 9 16,1 2332,89
[16,6-17,6) 5 17,1 1462,05
[17,6-18,6) 1 18,1 327,61

\(\sum mi^2fi=9428\) 

Luego de tener \(\sum mi^2fi=9428\) sustituimos 

\(S^2=\frac{9428-40(15,3)^2}{40-1}= \frac{64,4}{39}= 1,6512\)

2.3. Desviación estándar

\(S\sqrt{S^2}\)

\(S=\sqrt{1,6512}=1,28\)

Ejemplo 3. Para datos agrupados categóricos: 

Se toma información sobre el número de clientes que llegan a un banco en una hora pico, observando una muestra de 25 períodos de un minuto se obtuvieron los siguientes resultados: 8,6,7,9,8,7,8,10,4,10,8,7,9,8,7,6,5,10,7,8,5,6,8,10,11.

1.Distribución de frecuencias. 

Identificamos la variable en estudio 

X= Número de cliente que llegan a un banco en una hora pico durante un periodo de un minuto. 

Se organiza la información registrando los distintos datos de la muestra y haciendo un conteo de las veces que aparece. 

Clientes por minuto(xi) Frecuencia absoluta (fi) Frecuencia relativa (fri)
4 1 0,04
5 2 0,08
6 3 0,12
7 5 0,2
8 7 0,28
9 2 0,08
10 4 0,16
11 1 0,04
Totales 25 1

La frecuencia absoluta denotada por fi, es la suma de las veces que aparece en la muestra. Por ejemplo: 5 clientes por minuto esta presente 2 veces; por lo tanto la frecuencia absoluta correspondiente es 2. 

La frecuencia relativa es el número de datos expresados en proporción. Tiene por formula \(fri=\frac{fi}{n}\) Para finalizar nuestra tabla de frecuencia encontramos los valores correspondientes a las frecuencias absoluta y relativa acumuladas 

Clientes por minuto Frecuencia absoluta (fi) Frecuencia relativa(fri) Frecuencia absoluta acumulada  Frecuencia relativa acumulada 
4 1 0,04 1 0,04
5 2 0,08 3 0,12
6 3 0,12 6 0,24
7 5 0,2 11 0,44
8 7 0,28 18 0,72
9 2 0,08 20 0,8
10 4 0,16 24 0,96
11 1 0,04 25 1
Totales  25 1    

La frecuencia absoluta acumulada se denota por Fi, se halla sumando la frecuencia absoluta hasta que la variable tome el valor i. Es decir: 

F1=f1

F2=f1+f2

F3=f1+f2+f3

Fi= f1+f2+f3+..........................fi

Equivalente a \(Fi=\sum_{i=1}^{k}{fi}\) es de resaltar que \(\sum fi=n\), la suma de todas las frecuencias absolutas es igual al número de observaciones. 

La frecuencia relativa acumulada representada por Fri, se halla sumando la frecuencia relativa hasta que la variable tome el valor de i, es decir: 

Fr1=fr1

Fr2=fr1+fr2

Fr3=fr1+fr2+fr3

Fi= fr1+fr2+fr3+..........................fri

Equivalente a \(Fri=\sum_{i=1}^{k}{fri}\) es de resaltar que \(\sum fri=n\), la suma de todas las frecuencias relativas es igual a 1. 

1.Medidas de tendencia central. 

1.1.Media 

\(\bar{X}=\frac {\sum xifi}{n}\)

\(\bar{X}=\frac{(4*1)+(5*2)+(6*3)+(7*5)+(8*7)+(9*2)+(10*4)+(11*1)}{25}=7,68\)

1.2.Mediana 

Determinada por la clase que incluya el valor n/2 en la frecuencia absoluta acumulada 

n/2=25/2=12,5

Clientes por minuto(xi) Frecuencia absoluta(fi) Frecuencia relativa(fri) Frecuencia absoluta acumulada(fi) Frecuencia relativa acumulada(Fri)
4 1 0,04 1 0,04
5 2 0,08 3 0,12
6 3 0,12 6 0,24
7 5 0,2 11 0,44
8 7 0,28 18 0,72
9 2 0,08 20 0,8
10 4 0,16 24 0,96
11 1 0,04 25 1
Totales  25 1    

 La clase 8 clientes por minuto incluye las observaciones de la 12 a la 18 incluyendo al valor central de los datos que buscamos, el cual es 12,5. Por lo tanto la mediana en discusión es 8 clientes por minutos.

Mediana=8

1.3. Moda

La moda como el valor que más se repite se localiza buscando la mayor frecuencia absoluta. Por lo tanto la moda es de 8 clientes por minutos. 

Moda= 8

2. Medidas de dispersión. 

2.1. Rango

Es la diferencia entre la mayor observación y la menor observación. 

\(R=L_{max}-L_{min}=11-4=7\)

2.2.Varianza 

\({S}^2=\sum{(X_i - \overline{X})^2}*f_i/ n-1\)

\(S^{2}=\frac{(4-7,68)^2*1+(5-7,68)^2*2+....+(11-7,68)^2*1}{25-1}\)

\(S^{2}=\frac{75,44}{24}=3,14\)

2.3.Desviación estándar

Es simplemente la raíz cuadrada de la varianza. 

\(S=\sqrt{S^2}\)

\(S=\sqrt{3,14}=1,77\)

Histograma