Las medidas de tendencia central señalan el valor alrededor del cual se sitúa la mayor parte de los datos del grupo, y cumplen una función doble: Indican cuál es la posición del grupo (cuál es la magnitud general de la variable en el grupo), y reducen el conjunto de datos del grupo a un solo número (reducción de datos).

Las medidas de dispersión nos permiten conocer si los valores en general están cerca o alejados de los valores centrales, muestran la variabilidad de una distribución de datos, indicando por medio de un número si las diferentes puntuaciones de una variable están muy alejadas de la medida de tendencia central.

1) Una muestra de familias que tienen contratados los servicios de la United Bell Phone Company reveló los siguientes números de llamadas recibidas la semana pasada. Determine el número medio y el número mediano de llamadas recibidas

El número medio es: 

\(\bar{X}=\frac{\sum_{i=1}^{n}x_i}{n}=\frac{52+43+30+38+30+42+12+46+39+37+34+46+32+18+41+5}{16}\)

\(\bar{X}=\frac{545}{16}=34,0625\)

El número mediano de llamadas recibidas es: 

\(Md=\frac{x_{\frac{n}{2}}+x_{(\frac{n}{2})+1}}{2}=\frac{x_{\frac{16}{2}}+x_{\frac{16}{2}+1}}{2}=\frac{x_{8}+x_{9}}{2}\)

Ordenamos los datos de menor a mayor:

5  12  18  30  30  32  34  37  38  39  41  42  43  46  46  52 

\(Md=\frac{37+38}{2}=37,5\)

2) Los pesos (en libras) de una muestra de cinco cajas que se envían por UPS son: 12, 6,7,3 y 10. 

a) Calcule el rango 

b) Calcule la desviación media 

c) Calcule la desviación estándar 

a) \(R=Vmáx- Vmin=12-3=9\)

b) \(DM=\frac{\sum_{i=1}^{n}|x_i-\bar{X}|}{n}\)

     \(\bar{X}=\frac{\sum_{i=1}^{n}x_i}{n}=\frac{12+6+7+3+10}{5}=\frac{38}{5}=7,6\)

\(DM=\frac{|12-7,6|+|16-7,6|+|7-7,6|+|3-7,6|+|10-7,6|}{5}\)

\(DM=\frac{4,4+1,6+0,6+4,6+2,4}{5}=\frac{13,6}{5}=2,72\)

c) \(S=\sqrt{S^{2}}\)

Hallemos primero la varianza

\(S^{2}=\frac{\sum_{i=1}^{k}}{n}-\bar{X}\)

\(=\frac{(12)^{2}+(6)^{2}+(7)^{2}(3)^{2}(10)^{2}}{5}-(7,6)^{2}\)

\(S^{2}=\frac{338}{5}-57,76=67,6-57,76=9,84\)

Entonces: 

\(S=\sqrt{S^{2}}=\sqrt{9,84}=3,1368\)

3) Los problemas de salud son una preocupación de los gerentes, en especial al evaluar el costo de los seguros médicos. Una encuesta reciente entre 150 ejecutivos de Etvers Industries, una importante empresa de seguros y finanzas ubicada en el suroeste de Estados Unidos, reportó el número de libras de sobrepeso de los ejecutivos. Calcule la media y la desviación estándar 

a) Media:

\(\bar{X}=\frac{\sum_{i=1}^{n}xi}{n}\)

\(\bar{X}=\frac{14+42+58+28+8}{5}=\frac{150}{5}=30\)

b) Desviación estándar 

\(S=\sqrt{S}^{2}\)

Hallemos primero la varianza \(S^{2}\)

\(S^{2}=\frac{\sum_{i=1}^{k}x_i^{2}}{n}-\bar{X}^{2}\)

\(S^{2}=\frac{(14)^{2}+(42)^{2}+(58)^{2}+(28)^{2}+(8)^{2}}{5}-(30)^{2}\)

\(S^{2}=\frac{6177}{5}-900=1233,4-900=334,4\)

Entonces: 

\(S=\sqrt{334,4}=18,2866\)

4) Un artículo reciente sugería que si usted gana 25000 dólares al año en la actualidad y la tasa de inflación continúa siendo de 3% al año, dentro de 10 años, necesitará ganar 35598 dólares para tener el mismo poder adquisitivo. Necesitaría ganar 44771 dólares si la tasa de inflación aumenta a 6%. Confirme que estas afirmaciones son exactas encontrando la tasa de incremento media geométrica 

Ganancia esperada=\(\frac{44771}{35598}=1,257683\)

La tasa de Incremento Media Geométrica está dada por:

\(\bar{X}G=\sqrt[n]{x_1,x_2.....x_n}=\sqrt[10]{1,257683}=1,0291919\) (2,9% \(\approx\) 3% al año)

5) La tabla siguiente muestra el porcentaje de la fuerza laboral que está desempleada y el tamaño de la fuerza laboral para tres condados en el noroeste de Ohio. Jon Elsas es el Director Regional de Desarrollo Económico y debe presentar un informe ante varias empresas que consideran su reubicación en el noroeste de Ohio. ¿Cuál sería un índice de desempleo apropiado para toda la región? 

\(\bar{X}w=\frac{15300(4,5)+10400(3,0)+150600(10,2)}{176300}\)

\(=\frac{1636170}{176300}\)

\(\bar{X}w=9,28\)

El índice de desempleo apropiado para toda la región es 9,28

6) El departamento de producción de NDB Electronics quiere investigar la relación entre el número de empleados que arman una pieza de subensamblaje y el número producido. Como experimento, a dos empleados se les asigna la tarea de armar piezas de subensamblaje. Produjeron 15 durante un periodo de una hora. A continuación presentamos el conjunto total de observaciones por pares

La variable dependiente es la producción; es decir, se supone que el nivel de producción depende del número de empleados. 

a) Elabore un diagrama de dispersión

b) Con base en el diagrama de dispersión, ¿parece existir alguna relación entre el número de empleados y la producción? Explique su respuesta

c) Calcule el coeficiente de correlación

d) Evalúe la fuerza de la relación calculando el coeficiente de determinación

a) 

 

b) Al observar el Diagrama de Dispersión, se demuestra que en efecto los puntos están asociados como en forma de línea recta y adicional a esto, los puntos se encuentran pocos dispersos entre sí, esto nos indica una relación lineal entre el número de empleados y la producción. 

c) 

\(\bar{X}=\sum_{i=1}^{k}\frac{x_i}{n}=\frac{15}{5}=3\)

\(\bar{Y}=\sum_{i=1}^{k}\frac{y_i}{n}=\frac{120}{5}=24\)

\(\sigma_{x}^{2}=\frac{\sum_{i=1}^{k}x_i^{2}}{n}-\bar{X}^{2}\)

                         \(=\frac{55}{5}-(3)^{2}\)

\(\sigma_{x}^{2}==11-9=2\)

\(\sigma_{x}=\sqrt{\sigma _{x}^{2}}=\sqrt{2}=1,414\)

\(\sigma_{y}^{2}=\frac{\sum_{i=1}^{k}(y_i)^{2}}{n}-\bar{Y}^{2}\)

                        \(=\frac{3450}{5}-(24)^{2}\)

\(\sigma_{y}^{2}=690-576=114\)

\(\sigma_{y}=\sqrt{\sigma_{y}^{2}}=\sqrt{114}=10,677\)

\(\sigma_{x}\sigma_{y}=\frac{\sum_{i=1}^{k}x_iy_i}{n}-\bar{X}\bar{Y}\)

\(=\frac{430}{5}-(3)(24)\)

\(\sigma_{x}\sigma_{y}=86-72=14\)

Coeficiente de correlación: 

\(r=\frac{\sigma_{x}\sigma_{y}}{\sigma_{x}\sigma_{y}}= \frac{14}{(1,414)(10,677)}=0,927172\)

d) \(R^{2}=(O,927172)^{2}=0,8596\)      \(\rightarrow\)   85,96% 

7) The Bradford Electric Illuminating Company estudia la relación entre los killowatts-hora (miles) usados y el número de habitaciones en la residencia privada de una familia. Una muestra aleatoria de 10 casas dio los siguientes resultados: 

Número de habitaciones  Kilowatts-hora (miles)  
12 
14  10 
10 
10 
10 10
5 4
7 7
   
91 74
 

a) Determine la ecuación de la recta de regresión

b) Determine el número de kilowatts-hora en miles, para una casa de seis habitaciones

a) \(y_i=\bar{Y}+\beta_1(x_i-\bar{X})\)          Donde: \(\beta_1=\frac{\sigma xy}{\sigma_{x}^{2}}\)

  

\(\bar{X}=\sum_{i=1}^{k}\frac{x_i}{n}=\frac{91}{10}=9,1\)

\(\bar{Y}=\sum_{i=1}^{k}\frac{y_i}{n}=\frac{74}{10}=7,4\)

\(\sigma_{x}^{2}=\frac{\sum_{i=1}^{k}x_i^{2}}{n}-\bar{X}^{2}\)

   \(=\frac{895}{10}-(9,1)^{2}=89,5-82,8=6,69\)

\(\sigma_{x}\sigma_{y}=\frac{\sum_{i=1}^{k}x_iy_i}{n}-\bar{X}\bar{Y}\)

                                  \(=\frac{718}{10}-(9,1)(7,4)\)

\(\sigma_{x}\sigma_{y}=71,8-67,34=4,46\)

La Ecuación de la Recta de Regresión está dada por: 

\(y=7,4+(\frac{4,46}{6,69})(x-9,1)\)

\(y=7,4+0,67(x-9,1)\)

\(y=0,67x+1,303\)

b) \(y=0,67(6)+1,303=5,323\)    \(\approx\) 5 Kilowatts- hora (miles)

8) Un artículo reciente en Business Week mencionó las “Mejores Pequeñas Empresas”. Nos interesa conocer los resultados actuales de las ventas y ganancias de las compañías. Se seleccionó una muestra aleatoria de 12 empresas y a continuación se reportan sus ventas y ganancias, en millones de dólares

Sean las ventas la variable independiente y las ganancias la variable dependiente.

a) Elabore un diagrama de dispersión

b) Calcule el coeficiente de correlación

c) Calcule el coeficiente de determinación

d) Interprete sus descubrimientos en las partes b y c

e) Determine la ecuación de la recta de regresión

f) Calcule las ganancias para una compañía pequeña con 50 millones de dólares en ventas

a) 

b)

 

\(\bar{X}=\frac{\sum_{i=1}^{k}x_i}{n}=\frac{501,1}{12}=41,758\)

\(\bar{Y}=\frac{\sum_{i=1}^{k}y_i}{n}=\frac{64,1}{12}=5,34\)

\(\sigma_{x}^{2}=\frac{\sum_{i=1}^{k}x_i^{2}}{n}-\bar{X}^{2}=\frac{28458,99}{12}-(41,758)^{2}=2371,5825-1743,758=627,82\)

\(\sigma_{x}=\sqrt{627,82}=25,05\)

\(\sigma_{y}^{2}=\frac{\sum_{i=1}^{k}y_i^{2}}{n}-\bar{Y}^{2}=\frac{458,41}{12}-(5,34)^{2}=38,20-28,53=9,67\)

\(\sigma_{y}=\sqrt{9,67}=3,109\)

\(\sigma_{x}\sigma_{y}=\frac{\sum_{i=1}^{k}x_iy_i}{n}-(\bar{X})(\bar{Y})=\frac{3306,35}{12}-(41,758)(5,34)=275,529-222,987=52,541\)

Coeficiente de correlación: 

\(r=\frac{\sigma_{x}\sigma_{y}}{\sigma_{x}\sigma_{y}}= \frac{52,541}{(25,05)(3,109)}=0,67464\)

c) 

\(R^{2}=(0,67464)^{2}=0,4551\)   \(\rightarrow\)  45,51%

d) Podemos observar que el Coeficiente de determinación es inferior al de Correlación y que tan solo el 45,51% de la variabilidad de y se puede atribuir a la relación lineal con x. 

e) 

 \(y=5,34+(\frac{52,54}{627,82})(x-41,758)\)

 \(y=5,34+(0,08356)(x-41,758)\)

 \(y=0,0836x+1,845\)

f) 

\(y=0,0836(50)+1,845\)

\(y=4,18+1,845\)

\(y=6,025\)              \(\rightarrow\)   Ganancia en millones de dólares 

 

Referencia:

Lind, D. A., Marchal, W. G., & Wathen, S. A. (2009). Estadística aplicada a los negocios y a la economía (12a. ed.). México, D.F., México: McGraw-Hill Interamericana. Recuperado de http://site.ebrary.com/lib/vallemexicosp/reader.action?docID=10485736