Blog de Lic. Jorge Alejandro Zelaya, Socio Fundador de El Salvador Legis Abogados Notarios y Contadores de El Salvador
Mostrando entradas con la etiqueta Estadistica. Mostrar todas las entradas
Mostrando entradas con la etiqueta Estadistica. Mostrar todas las entradas
sábado, 21 de febrero de 2015
viernes, 20 de febrero de 2015
Cómo trabajar con tablas de datos agrupados en Estadística
Cómo trabajar con tablas de datos agrupados en Estadística
En este post trataré un tema más
específico, dedicado principalmente a las personas que estén haciendo
algún curso de Estadística Descriptiva en la universidad. De igual forma
lo explicaré paso paso y creo que con algunos conocimientos previos del
curso es fácil comprenderlo para cualquiera que desee aprender.
Tabla de frecuencias para datos agrupados.
Cuando se tienen muchos datos
cuantitativos y éstos se encuentran dispersos, es conveniente formar
grupos o intervalos para elaborar la Tabla de Frecuencias y presentar la información. A continuación aparecerán los pasos que se deben seguir para construir la tabla de frecuencias.
- Determinar el número de intervalos a formar. Para hallarlo se utiliza la siguiente ecuación: K= 1 + 1.32 log n. Dónde n corresponde al número total de datos que hay en la muestra.
- Determinar el rango de los datos. Es la diferencia entre el Dato Mayor (Xmax) y el Dato Menor (Xmin). Rango= Xmax – Xmin
- Determinar la amplitud de los intervalos. Debe ser igual para todos los intervalos. Es el cociente entre el rango y el número de intervalos. Amplitud= Rango/k El resultado que se obtiene siempre se aproxima al entero superior. Por ejemplo si nos da 6.77 aproximamos a 7.
- Determinar la marca de clase. Esta se halla luego de tener los intervalos formados. Es la sumatoria entre el límite inferior y el límite superior dividido 2. Xi= (Lim. Inferior + Lim. Superior)/2. Se debe tener en cuenta lo siguiente, el límite inferior siempre es abierto y el límite superior es cerrado. Así: (7,13] esto quiere decir que el 7 no se incluye pero el 13 sí.
- Calcular el rango ampliado. Es el producto entre la amplitud y el número de intervalos. Rango ampliado= Amplitud * K
- Calcular la diferencia entre rangos. Es la diferencia entre el rango ampliado y el rango inicial. Rango Ampliado – Rango Inicial. El resultado de esta diferencia siempre se descompone en dos valores así: Si el resultado es par se descompone en dos números iguales y al dato menor se le resta este número para obtener el límite inferior de la tabla; y al dato mayor se le suma el mismo número para obtener el límite superior de la tabla. En caso de que el resultado sea un número impar, este se descompone en dos números consecutivos y se aplica la misma regla anterior. Al dato menor se le resta el menor y al dato mayor se le suma el mayor.
miércoles, 18 de febrero de 2015
¿CÓMO SE CONSTRUYE UNA TABLA DE FRECUENCIAS?
Tabla de Distribución de Frecuencias
Una tabla de distribución de frecuencias es
una tabla que nos permite organizar los datos de tal manera que nos
sirvan para la toma de decisiones.
Procedimiento para su construcción:
Para describir el procedimiento de construcción de la tabla de distribución de frecuencias, tomemos el siguiente ejemplo.
Ejemplo: El conjunto de datos presentados en seguida, representan las edades de 30 profesores del TEC.
Construye la tabla de distribución de frecuencias para ellos.
32
|
38
|
26
|
29
|
32
|
41
|
28
|
31
|
45
|
36
|
45
|
35
|
40
|
30
|
31
|
40
|
37
|
33
|
28
|
30
|
30
|
41
|
39
|
38
|
33
|
35
|
31
|
36
|
37
|
32
|
1. Cálculo del rango
Datos del problema
32
|
38
|
26
|
29
|
32
|
41
|
28
|
31
|
45
|
36
|
45
|
35
|
40
|
30
|
31
|
40
|
37
|
33
|
28
|
30
|
30
|
41
|
39
|
38
|
33
|
35
|
31
|
36
|
37
|
32
|
Del conjunto de datos en bruto, se busca el de mayor magnitud (VM) y el de menor magnitud (Vm). Con ellos se calcula el rango.
Rango = VM -Vm = 45 - 26 = 19
2. Designación del número de clases
Datos del problema.
32
|
38
|
26
|
29
|
32
|
41
|
28
|
31
|
45
|
36
|
45
|
35
|
40
|
30
|
31
|
40
|
37
|
33
|
28
|
30
|
30
|
41
|
39
|
38
|
33
|
35
|
31
|
36
|
37
|
32
|
Una vez calculado el rango, se procede a designar el número de clases, a través de cualquiera de los dos métodos siguientes:
a) Primer método.
en donde:
K: es el número de clases
n: es el número de datos por agrupar.
b) Segundo método.
n
|
k
|
n < 50
|
5 a 7
|
50 <= n < 100
|
6 a 10
|
100 <= n < 250
|
7 a 12
|
n >= 250
|
10 a 20
|
Usando el primer procedimiento tenemos que:
Para nuestro ejemplo, K = ln 30/ ln 2 = 4.907 que al redondear a enteros, quedaría una K = 5.
Si usamos el
segundo método, podremos observar que n = 30 es menor que 50 y se nos
recomienda, de acuerdo a la tabla, que tomemos de 5 a 7 clases, por lo
tanto K = 5 es una buena asignación.
3. Cálculo de la amplitud
La amplitud se calcula redondeando el cociente del rango entre el número de clases (R/K)
a la unidad más pequeña (u) inmediata superior en que se encuentran los
datos brutos. Como los datos de nuestro ejemplo están en enteros, la
unidad más pequeña es un entero u = 1, de tal manera que la amplitud será, R/K = 19/5 = 3.8 que al redondearlo al entero inmediata superior, nos dará la amplitud.
Amplitud : A = 4.
4. Cálculo de los limites de clase
Datos del problema.
32
|
38
|
26
|
29
|
32
|
41
|
28
|
31
|
45
|
36
|
45
|
35
|
40
|
30
|
31
|
40
|
37
|
33
|
28
|
30
|
30
|
41
|
39
|
38
|
33
|
35
|
31
|
36
|
37
|
32
|
Para construir los límites de clase ( límite inferior Li y límite superior Ls)
se coloca como límite inferior de la primera clase al valor más pequeño
de los datos brutos, 26 para nuestro ejemplo, y cuatro enteros (la unidad más pequeña es un entero) más adelante, incluyendo el 26, tendremos el límite superior de la primera clase, 26 + 3 = 29 ( se suma solo tres entero porque el 26 está incluido).
Clases
|
Li - Ls
|
1
|
26 - 29
|
Para calcular el
límite inferior de la segunda clase, hay que agregarle un entero al
límite superior de la primera clase, esto es 29 + 1 = 30. El límite
superior es 4 enteros adelante, incluyendo al 30, esto es 29 + 4 = 33.
Este proceso se repite iterativamente hasta completar la clase número 5.
Clases
|
Li - Ls
|
1
|
26 - 29
|
2
|
30 -33
|
3
|
34 - 37
|
4
|
38 - 41
|
5
|
42 - 45
|
5. Cálculo de los límites reales de clase
En seguida se
calculan los límites reales de clase, llamados también fronteras de
clase. Estos se calculan a partir de los límites de clase, restándole
media unidad (u/2) a los límites inferiores de clase y sumándole la
misma cantidad a los límites superiores. u/2 = 1/2 = 0.5
Clases
|
Li - Ls
|
Lri - Lrs
|
1
|
26 - 29
|
25.5 - 29.5
|
2
|
30 - 33
|
29.5 - 33.5
|
3
|
34 - 37
|
33.5 - 37.5
|
4
|
38 - 41
|
37.5 - 41.5
|
5
|
42 - 45
|
41.5 - 45.5
|
6. Encontrando la marca de clase o punto medio
Para calcular la
marca de clase o punto medio vamos a promediar, para cada clase, el
límite inferior y superior de clase o en su defecto los límites reales.
Para la clase uno, X1 = (26 + 29)/2 = (25.5 + 29.5)/2 = 27.5
Para las siguientes clases se procede de la misma forma o simplemente se
le suma la amplitud a la marca de clase anterior, por ejemplo, X2 = X1 + 4 = 27.5 + 4 = 31.5, y así para el resto de las clases.
Clases
|
Li - Ls
|
Lri - Lrs
|
Xi
|
1
|
26 -29
|
25.5 - 29.5
|
27.5
|
2
|
30 -33
|
29.5 - 33.5
|
31.5
|
3
|
34 - 37
|
33.5 - 37.5
|
35.5
|
4
|
38 - 41
|
37.5 - 41.5
|
39.5
|
5
|
42 - 45
|
41.5 - 45.5
|
43.5
|
7. Conteo y Frecuencia Absoluta
El conteo es la
asignación de cada dato en la clase que le corresponde. La frecuencia
absoluta es el número de datos que se encuentran ubicados en cada clase.
Para nuestro ejemplo, tenemos:
Datos brutos
32
|
38
|
26
|
29
|
32
|
41
|
28
|
31
|
45
|
36
|
45
|
35
|
40
|
30
|
31
|
40
|
37
|
33
|
28
|
30
|
30
|
41
|
39
|
38
|
33
|
35
|
31
|
36
|
37
|
32
|
Tabla de frecuencias absolutas
Clases
|
Li - Ls
|
Lri - Lrs
|
Xi
|
fi
|
1
|
26 -29
|
25.5 - 29.5
|
27.5
|
4
|
2
|
30 -33
|
29.5 - 33.5
|
31.5
|
11
|
3
|
34 - 37
|
33.5 - 37.5
|
35.5
|
6
|
4
|
38 - 41
|
37.5 - 41.5
|
39.5
|
7
|
5
|
42 - 45
|
41.5 - 45.5
|
43.5
|
2
|
8. Frecuencia Relativa
La frecuencia
relativa es la proporción de los datos que se encuentran en cada clase.
Se calcula dividiendo la frecuencia absoluta entre el total de los datos
y se puede expresar como una fracción o en forma de porcentaje.
Clases
|
Li - Ls
|
Lri - Lrs
|
Xi
|
fi
|
hi
|
1
|
26 -29
|
25.5 - 29.5
|
27.5
|
4
|
4/30, 13.33%
|
2
|
30 -33
|
29.5 - 33.5
|
31.5
|
11
|
11/30, 36.67%
|
3
|
34 - 37
|
33.5 - 37.5
|
35.5
|
6
|
6/30, 20.00%
|
4
|
38 - 41
|
37.5 - 41.5
|
39.5
|
7
|
7/30, 23.33%
|
5
|
42 - 45
|
41.5 - 45.5
|
43.5
|
2
|
2/30, 6.67%
|
9. Frecuencias Absolutas y Relativas Acumuladas
Para agregar a la
tabla de distribución de frecuencias las frecuencias acumuladas, tanto
absolutas como relativas, hay que generar la columna menor que (<). Dicha columna está formada por todos los limites reales de clase y quedaría de la siguiente manera:
|
|
|
|
|
|
<
|
Clases
|
Li - Ls
|
Lri - Lrs
|
Xi
|
fi
|
hi
|
25.5
|
1
|
26 -29
|
25.5 - 29.5
|
27.5
|
4
|
13.33%
|
29.5
|
2
|
30 -33
|
29.5 - 33.5
|
31.5
|
11
|
36.67%
|
33.5
|
3
|
34 - 37
|
33.5 - 37.5
|
35.5
|
6
|
20.00%
|
37.5
|
4
|
38 - 41
|
37.5 - 41.5
|
39.5
|
7
|
23.33%
|
41.5
|
5
|
42 - 45
|
41.5 - 45.5
|
43.5
|
2
|
6.67%
|
45.5
|
Para generar la
frecuencia absoluta acumulada nos debemos de preguntar ¿cuántos datos
son menores que los limites reales?. Por ejemplo: ¿Cuántos datos son
menores que 25.5? La respuesta es ninguno, ya que todos son mayores que
esa cantidad. ¿Cuántos datos son menores que 29.5? La respuesta es 4. A
la pregunta, ¿cuántos datos son menores que 33.5? La respuesta es 4 + 11
= 15, y así sucesivamente hasta terminar con la columna menor que.
|
|
|
|
|
|
<
|
Fi
|
Clases
|
Li - Ls
|
Lri - Lrs
|
Xi
|
fi
|
hi
|
25.5
|
0
|
1
|
26 -29
|
25.5 - 29.5
|
27.5
|
4
|
13.33%
|
29.5
|
4
|
2
|
30 -33
|
29.5 - 33.5
|
31.5
|
11
|
36.67%
|
33.5
|
15
|
3
|
34 - 37
|
33.5 - 37.5
|
35.5
|
6
|
20.00%
|
37.5
|
21
|
4
|
38 - 41
|
37.5 - 41.5
|
39.5
|
7
|
23.33%
|
41.5
|
28
|
5
|
42 - 45
|
41.5 - 45.5
|
43.5
|
2
|
6.67%
|
45.5
|
30
|
Para generar la
frecuencia relativa acumulada nos debemos de preguntar ¿qué porcentaje
de los datos son menores que los limites reales?. Por ejemplo: ¿Qué
porcentaje de los datos son menores que 25.5? La respuesta es ninguno,
ya que todos son mayores que esa cantidad. ¿Qué porcentaje de los datos
son menores que 29.5? La respuesta es 13.33%. A la pregunta, ¿qué
porcentaje de los datos son menores que 33.5? La respuesta es 13.33 +
36.67 = 50%, y así sucesivamente hasta terminar con la columna menor
que.
|
|
|
|
|
|
<
|
Fi
|
Hi
|
Clases
|
Li - Ls
|
Lri - Lrs
|
Xi
|
fi
|
hi
|
25.5
|
0
|
0%
|
1
|
26 -29
|
25.5 - 29.5
|
27.5
|
4
|
13.33%
|
29.5
|
4
|
13.33%
|
2
|
30 -33
|
29.5 - 33.5
|
31.5
|
11
|
36.67%
|
33.5
|
15
|
50.00%
|
3
|
34 - 37
|
33.5 - 37.5
|
35.5
|
6
|
20.00%
|
37.5
|
21
|
70.00%
|
4
|
38 - 41
|
37.5 - 41.5
|
39.5
|
7
|
23.33%
|
41.5
|
28
|
93.33%
|
5
|
42 - 45
|
41.5 - 45.5
|
43.5
|
2
|
6.67%
|
45.5
|
30
|
100%
|
Suscribirse a:
Entradas (Atom)