Mostrando entradas con la etiqueta Estadistica. Mostrar todas las entradas
Mostrando entradas con la etiqueta Estadistica. Mostrar todas las entradas

viernes, 20 de febrero de 2015

Cómo trabajar con tablas de datos agrupados en Estadística

Cómo trabajar con tablas de datos agrupados en Estadística


En este post trataré un tema más específico, dedicado principalmente a las personas que estén haciendo algún curso de Estadística Descriptiva en la universidad. De igual forma lo explicaré paso paso y creo que con algunos conocimientos previos del curso es fácil comprenderlo para cualquiera que desee aprender.

Tabla de frecuencias para datos agrupados.

Cuando se tienen muchos datos cuantitativos y éstos se encuentran dispersos, es conveniente formar grupos o intervalos para elaborar la Tabla de Frecuencias y presentar la información. A continuación aparecerán los pasos que se deben seguir para construir la tabla de frecuencias.
  • Determinar el número de intervalos a formar. Para hallarlo se utiliza la siguiente ecuación: K= 1 + 1.32 log n. Dónde n corresponde al número total de datos que hay en la muestra.
  • Determinar el rango de los datos. Es la diferencia entre el Dato Mayor (Xmax) y el Dato Menor (Xmin). Rango= Xmax – Xmin
  • Determinar la amplitud de los intervalos. Debe ser igual para todos los intervalos. Es el cociente entre el rango y el número de intervalos.  Amplitud= Rango/k El resultado que se obtiene siempre se aproxima al entero superior. Por ejemplo si nos da 6.77 aproximamos a 7.
  • Determinar la marca de clase. Esta se halla luego de tener los intervalos formados. Es la sumatoria entre el límite inferior y el límite superior dividido 2. Xi= (Lim. Inferior + Lim. Superior)/2. Se debe tener en cuenta lo siguiente, el límite inferior siempre es abierto y el límite superior es cerrado. Así: (7,13] esto quiere decir que el 7 no se incluye  pero el 13 sí.
  • Calcular el rango ampliado. Es el producto entre la amplitud y el número de intervalos. Rango ampliado= Amplitud * K
  • Calcular la diferencia entre rangos. Es la diferencia entre el rango ampliado y el rango inicial. Rango Ampliado – Rango Inicial. El resultado de esta diferencia siempre se descompone en dos valores así: Si el resultado es par se descompone en dos números iguales y al dato menor se le resta este número para obtener el límite inferior de la tabla; y al dato mayor se le suma el mismo número para obtener el límite superior de la tabla. En caso de que el resultado sea un número impar, este se descompone en dos números consecutivos y se aplica la misma regla anterior. Al dato menor se le resta el menor y al dato mayor se le suma el mayor.

miércoles, 18 de febrero de 2015

¿CÓMO SE CONSTRUYE UNA TABLA DE FRECUENCIAS?

Tabla de Distribución de Frecuencias
Una tabla de distribución de frecuencias es una tabla que nos permite organizar los datos de tal manera que nos sirvan para la toma de decisiones.
Procedimiento para su construcción:
Para describir el procedimiento de construcción de la tabla de distribución de frecuencias, tomemos el siguiente ejemplo.
Ejemplo: El conjunto de datos presentados en seguida, representan las edades de 30 profesores del TEC.
Construye la tabla de distribución de frecuencias para ellos.
32
38
26
29
32
41
28
31
45
36
45
35
40
30
31
40
37
33
28
30
30
41
39
38
33
35
31
36
37
32
1. Cálculo del rango
Datos del problema
32
38
26
29
32
41
28
31
45
36
45
35
40
30
31
40
37
33
28
30
30
41
39
38
33
35
31
36
37
32
Del conjunto de datos en bruto, se busca el de mayor magnitud (VM) y el de menor magnitud (Vm). Con ellos se calcula el rango.
Rango = VM -Vm = 45 - 26 = 19
2. Designación del número de clases
Datos del problema.
32
38
26
29
32
41
28
31
45
36
45
35
40
30
31
40
37
33
28
30
30
41
39
38
33
35
31
36
37
32
Una vez calculado el rango, se procede a designar el número de clases, a través de cualquiera de los dos métodos siguientes:
a) Primer método.
en donde:
K: es el número de clases
n: es el número de datos por agrupar.
b) Segundo método.
n
k
n < 50
5 a 7
50 <= n < 100
6 a 10
100 <= n < 250
7 a 12
n >= 250
10 a 20
Usando el primer procedimiento tenemos que:
Para nuestro ejemplo, K = ln 30/ ln 2 = 4.907 que al redondear a enteros, quedaría una K = 5.
Si usamos el segundo método, podremos observar que n = 30 es menor que 50 y se nos recomienda, de acuerdo a la tabla, que tomemos de 5 a 7 clases, por lo tanto K = 5 es una buena asignación.
3. Cálculo de la amplitud
La amplitud se calcula redondeando el cociente del rango entre el número de clases (R/K) a la unidad más pequeña (u) inmediata superior en que se encuentran los datos brutos. Como los datos de nuestro ejemplo están en enteros, la unidad más pequeña es un entero u = 1, de tal manera que la amplitud será, R/K = 19/5 = 3.8 que al redondearlo al entero inmediata superior, nos dará la amplitud.
Amplitud : A = 4.
4. Cálculo de los limites de clase
Datos del problema.
32
38
26
29
32
41
28
31
45
36
45
35
40
30
31
40
37
33
28
30
30
41
39
38
33
35
31
36
37
32
Para construir los límites de clase ( límite inferior Li y límite superior Ls) se coloca como límite inferior de la primera clase al valor más pequeño de los datos brutos, 26 para nuestro ejemplo, y cuatro enteros (la unidad más pequeña es un entero) más adelante, incluyendo el 26, tendremos el límite superior de la primera clase, 26 + 3 = 29 ( se suma solo tres entero porque el 26 está incluido).
Clases
Li - Ls
1
26 - 29
Para calcular el límite inferior de la segunda clase, hay que agregarle un entero al límite superior de la primera clase, esto es 29 + 1 = 30. El límite superior es 4 enteros adelante, incluyendo al 30, esto es 29 + 4 = 33. Este proceso se repite iterativamente hasta completar la clase número 5.
Clases
Li - Ls
1
26 - 29
2
30 -33
3
34 - 37
4
38 - 41
5
42 - 45
5. Cálculo de los límites reales de clase
En seguida se calculan los límites reales de clase, llamados también fronteras de clase. Estos se calculan a partir de los límites de clase, restándole media unidad (u/2) a los límites inferiores de clase y sumándole la misma cantidad a los límites superiores. u/2 = 1/2 = 0.5
Clases
Li - Ls
Lri - Lrs
1
26 - 29
25.5 - 29.5
2
30 - 33
29.5 - 33.5
3
34 - 37
33.5 - 37.5
4
38 - 41
37.5 - 41.5
5
42 - 45
41.5 - 45.5
6. Encontrando la marca de clase o punto medio
Para calcular la marca de clase o punto medio vamos a promediar, para cada clase, el límite inferior y superior de clase o en su defecto los límites reales. Para la clase uno, X1 = (26 + 29)/2 = (25.5 + 29.5)/2 = 27.5 Para las siguientes clases se procede de la misma forma o simplemente se le suma la amplitud a la marca de clase anterior, por ejemplo, X2 = X1 + 4 = 27.5 + 4 = 31.5, y así para el resto de las clases.
Clases
Li - Ls
Lri - Lrs
Xi
1
26 -29
25.5 - 29.5
27.5
2
30 -33
29.5 - 33.5
31.5
3
34 - 37
33.5 - 37.5
35.5
4
38 - 41
37.5 - 41.5
39.5
5
42 - 45
41.5 - 45.5
43.5
7. Conteo y Frecuencia Absoluta
El conteo es la asignación de cada dato en la clase que le corresponde. La frecuencia absoluta es el número de datos que se encuentran ubicados en cada clase. Para nuestro ejemplo, tenemos:
Datos brutos
32
38
26
29
32
41
28
31
45
36
45
35
40
30
31
40
37
33
28
30
30
41
39
38
33
35
31
36
37
32
Tabla de frecuencias absolutas
Clases
Li - Ls
Lri - Lrs
Xi
fi
1
26 -29
25.5 - 29.5
27.5
4
2
30 -33
29.5 - 33.5
31.5
11
3
34 - 37
33.5 - 37.5
35.5
6
4
38 - 41
37.5 - 41.5
39.5
7
5
42 - 45
41.5 - 45.5
43.5
2
8. Frecuencia Relativa
La frecuencia relativa es la proporción de los datos que se encuentran en cada clase. Se calcula dividiendo la frecuencia absoluta entre el total de los datos y se puede expresar como una fracción o en forma de porcentaje.
Clases
Li - Ls
Lri - Lrs
Xi
fi
hi
1
26 -29
25.5 - 29.5
27.5
4
4/30, 13.33%
2
30 -33
29.5 - 33.5
31.5
11
11/30, 36.67%
3
34 - 37
33.5 - 37.5
35.5
6
6/30, 20.00%
4
38 - 41
37.5 - 41.5
39.5
7
7/30, 23.33%
5
42 - 45
41.5 - 45.5
43.5
2
2/30, 6.67%
9. Frecuencias Absolutas y Relativas Acumuladas
Para agregar a la tabla de distribución de frecuencias las frecuencias acumuladas, tanto absolutas como relativas, hay que generar la columna menor que (<). Dicha columna está formada por todos los limites reales de clase y quedaría de la siguiente manera:
 
 
 
 
 
 
< 
Clases
Li - Ls
Lri - Lrs
Xi
fi
hi
25.5
1
26 -29
25.5 - 29.5
27.5
4
13.33%
29.5
2
30 -33
29.5 - 33.5
31.5
11
36.67%
33.5
3
34 - 37
33.5 - 37.5
35.5
6
20.00%
37.5
4
38 - 41
37.5 - 41.5
39.5
7
23.33%
41.5
5
42 - 45
41.5 - 45.5
43.5
2
6.67%
45.5
Para generar la frecuencia absoluta acumulada nos debemos de preguntar ¿cuántos datos son menores que los limites reales?. Por ejemplo: ¿Cuántos datos son menores que 25.5? La respuesta es ninguno, ya que todos son mayores que esa cantidad. ¿Cuántos datos son menores que 29.5? La respuesta es 4. A la pregunta, ¿cuántos datos son menores que 33.5? La respuesta es 4 + 11 = 15, y así sucesivamente hasta terminar con la columna menor que.
 
 
 
 
 
 
< 
Fi
Clases
Li - Ls
Lri - Lrs
Xi
fi
hi
25.5
0
1
26 -29
25.5 - 29.5
27.5
4
13.33%
29.5
4
2
30 -33
29.5 - 33.5
31.5
11
36.67%
33.5
15
3
34 - 37
33.5 - 37.5
35.5
6
20.00%
37.5
21
4
38 - 41
37.5 - 41.5
39.5
7
23.33%
41.5
28
5
42 - 45
41.5 - 45.5
43.5
2
6.67%
45.5
30
Para generar la frecuencia relativa acumulada nos debemos de preguntar ¿qué porcentaje de los datos son menores que los limites reales?. Por ejemplo: ¿Qué porcentaje de los datos son menores que 25.5? La respuesta es ninguno, ya que todos son mayores que esa cantidad. ¿Qué porcentaje de los datos son menores que 29.5? La respuesta es 13.33%. A la pregunta, ¿qué porcentaje de los datos son menores que 33.5? La respuesta es 13.33 + 36.67 = 50%, y así sucesivamente hasta terminar con la columna menor que.
 
 
 
 
 
 
< 
Fi
Hi
Clases
Li - Ls
Lri - Lrs
Xi
fi
hi
25.5
0
0%
1
26 -29
25.5 - 29.5
27.5
4
13.33%
29.5
4
13.33%
2
30 -33
29.5 - 33.5
31.5
11
36.67%
33.5
15
50.00%
3
34 - 37
33.5 - 37.5
35.5
6
20.00%
37.5
21
70.00%
4
38 - 41
37.5 - 41.5
39.5
7
23.33%
41.5
28
93.33%
5
42 - 45
41.5 - 45.5
43.5
2
6.67%
45.5
30
100%