GUIA DE MANEJO DE EXCEL PARA
LA
ASIGNATURA ESTADÍSTICA DESCRIPTIVA
Proyecto
Piloto ECTS
CURSO 2006/07
MANEJO DE LA HOJA DE CALCULO EXCEL PARA ANÁLISIS DESCRIPTIVO Y EXPLORATORIO DE DATOS.
INTRODUCCIÓN A LA
HOJA DE CALCULO.
Excel es una hoja de calculo que facilita los cálculos y la obtención de indicadores y estadísticos para estudiar el
comportamiento de una o varias variables.
Se podría entender
como una matriz de filas y columnas. Cada combinación de fila y columna se denomina celda. Por ejemplo la celda A1, B33, Z68.
Un conjunto de celdas se
denomina rango, y en Excel se expresa como A1:B4. En cada celda
se puede recoger:
-
rótulo
-
número
-
fórmula
Como su nombre
indica, la hoja de cálculo
nos permite calcular, hacer
operaciones matemáticas,
lógicas, estadísticas, financieras, etc..
Con la hoja de cálculo EXCEL (u otras similares) se pueden obtener fácilmente
estadísticos y medidas que resuman
y caractericen una variable, una distribución de frecuencias, o una distribución bidimensional (n-dimensional) de frecuencias, es decir varias
variables conjuntamente.
La primera pantalla que
aparece en Excel es la
siguiente:
Un primer recorrido por
la hoja de cálculo nos permite
conocer las:
-
opciones de menú
-
barra de herramientas
-
barra
de estado.....
Podemos utilizar la hoja de cálculo:
1.- Para obtener representaciones
gráficas según el tipo de variable
2.- Para ir haciendo los cálculos necesarios para obtener los distintos estadísticos (media, mediana, moda, cuantiles,
varianzas, g1, etc). A partir de unos datos (o de una distribución de frecuencias) hacemos
los cálculos necesarios para desarrollar una fórmula y paso a paso calcular
hasta obtener el resultado
final. (Sumas, productos, divisiones, potencias, raíces,
etc…)
3.- Para obtener fácilmente estadísticos como promedios, varianzas, cuartiles, covarianzas, regresión, etc.., aplicando
una lista de funciones previamente programadas en la hoja de cálculo. (Insertar
+ funciones o el símbolo fx de los botones de las barras
de herramientas). (Ver listado de funciones y argumentos que requieren)
4.- Para analizar un conjunto de información. Se usará en el menú de Herramientas la opción Analizar
Datos. Permite describir un conjunto de información correspondiente a una o varias variables. Los datos de entrada son con frecuencia unitaria ( si un valor se repite varias
veces aparece repetido
ese número de veces).
También permite aplicar
técnicas estadísticas más sofisticadas (regresión, contrastes de hipótesis,
estimación por intervalos, etc...).
REPRESENTACIONES GRÁFICAS:
Insertar gráfico, o el icono
correspondiente a gráficos, y seguimos
los pasos que nos sugiere el
asistente para gráficos:
Elegir tipo de gráfico Definir rango de datos
Etiquetar ejes y gráfico, leyenda, etc..
Decidir dónde se ha de representar el gráfico (en la hoja, en hoja nueva, etc...)
Para cada variable,
según sus propiedades de medida,
elegimos uno o varios gráficos según los aspectos o detalles que queramos resaltar.
Variables cualitativas: Barras,
circular, columnas, anillos, ..
Variables cuantitativas: Histograma (que aparece en Herramientas Analizar Datos)
2 variables cuantitativas: Dispersión XY
2 variables cualitativas: columnas en espacio tridimensional (xi, yj, nij) Listado de gráficos tipo estándar
Listado de
gráficos personalizados.
Una vez obtenido
el gráfico, luego
se puede editar
y cambiar los aspectos
de formato que nos interese:
(rótulos, colores,
rejillas, escalas, etc...). Incluso
se le pueden añadir rótulos de textos, flechas o figuras,
etc...
EXCEL PARA ANALIZAR DATOS CALCULANDO LAS FORMULAS
La mecánica
es similar al procedimiento que utilizamos para resolver problemas de estadística utilizando una calculadora. Es importante rotular y disponer
de manera clara y ordenada los cálculos. Esto facilita su posterior uso e incluso
la revisión de los
procedimientos si se detectan
errores.
Como ya se ha indicado, una celda puede contener un rótulo, un número
o una fórmula. Para crear una fórmula
empezamos tecleando en una celda, por ejemplo la C1, el
símbolo “=”, y la operación
que deseamos realizar. Puede ser un simple cálculo matemático: =7+5, y nos da un resultado 12. Pero puede ser una fórmula =A1+B1.
Si en la celda A1 hay un 7 y en la B1 un 3, aparecerá
el mismo resultado 12, sin embargo ya no
es un número, sino una fórmula. Esto tiene dos implicaciones
importantes:
1.- Si cambian los valores de las celdas A1 y B1, cambia el resultado en C1 obteniendo
la suma de los nuevos números.
2.- Cuando copio la celda C1 a otra celda, no copio el valor, sino la fórmula.
Aunque aparentemente a la vista sólo veamos un número en la celda, al copiar esa celda lo que copio no es el resultado, sino la fórmula.
Al copiar, cuando nos desplazarnos hacia la
derecha-izquierda (por columnas manteniéndonos en la misma fila)
en la hoja de cálculo, la fórmula
se desplaza en “letras”.
Sin embargo, cuando nos desplazarnos hacia la arriba-abajo (por filas manteniéndonos en la misma columna) en la hoja de cálculo, la fórmula
se desplaza en “números”.
Podemos indicarle en la fórmula que mantenga
fijo la fila, la columna o ambas.
Para ello deberemos
anteponer el símbolo $ antes de la letra (columna), o antes del número
(fila) o antes de las dos (fila y columna, es decir celda)
de la identificación de la celda.
Algunas de las operaciones matemáticas que puede
hacer son: Suma
= ..+..
División =.. /..
Elevar al cuadrado =..^2 Elevar
a potencia n =..^n Raiz
=raiz(..)
Calcular valor
absoluto =abs(..) Calcular
raíz n-esima=... ^(1/n) Calcular logaritmos =LN(..) Etc..
Sumar un rango
de valores con la autosuma (=suma(..),
ó símbolo ∑)
Con ello se puede calcular:
Fi,
fi, Ni, N, xini, m2, m3, g1, g2, Sxy, rxy, tasas
variación, etc....)
Conviene, en la medida de lo posible, formular los cálculos indicando
la posición dentro
de la hoja (celdas)
y no los valores (números). Eso nos permitirá hacer ejemplos
similares con muy poco esfuerzo,
cambiando sólo los datos de partida y aprovechando toda
la estructura de cálculos a partir de ellos.
CALCULOS EN EXCEL APLICANDO FUNCIONES.
Para poder aplicar funciones fx las frecuencias han de ser unitarias. Es decir cada valor estará
repetido tantas veces como indique
su frecuencia.
Una distribución de frecuencias como
Xi
|
ni
|
3
|
3
|
4
|
3
|
5
|
2
|
2
|
2
|
Quedaría:
Xi 3 3
3 4 4 4 5 5 2 2
Usando las funciones podremos calcular:
máximo y mínimo
valor, recuento de frecuencias, promedios, cuantiles, mediana, moda, media armónica,
geométrica, media recortada, varianza y desviación típica, medidas
de forma, etc...
También podemos calcular
algunos estadísticos bidimensionales: covarianza, correlación, estimación lineal, estimación logarítmica,
tendencia, pronóstico, etc.
En el menú insertar, seleccionar
la opción
función, seleccionar la categoría
de
Estadísticas y dentro
de ellas la que interese.
A continuación habrá que rellenar
el cuadro de diálogo. Por ejemplo:
La función promedio, permite calcular la media aritmética. Aparece en la parte inferior
del cuadro de diálogo una breve descripción de la función, y permite
solicitar más información sobre ella en Ayuda sobre esta
función.
En este caso los argumentos de la función,
lo que habría que rellenar
en el cuadro de diálogo
es el conjunto de celdas
en los que se encuentras los valores de la variable.
En Número1 habrá que indicarle
el rango de celdas, por ejemplo A1:A30, o pinchando
en el recuadro que hay a la
derecha, marcar con el ratón dichas celdas.
A continuación se ofrece una breve guía de las funciones, indicando su correspondencia con los estadísticos que se explican
en clase y alguna información adicional
sobre el significado de los argumentos de la función.
COEF.DE.CORREL (r).
Dar rango de valores de las variables X e Y.
COEFICIENTE.ASIMETRIA (g1).
Rango de valores de la variable.
COEFICIENTE.R2
(r2)
Dar rango de valores de las variables X e Y.
CONTAR
Rango de valores de la variable. Cuenta el número de
valores.
CONTAR.SI
Especificar rango de valores
de la variable y criterio. Por ejemplo
número de veces que una variable se repite el 3. El criterio puede ser un número o una celda
de la hoja de cálculo.
COVAR (Sxy)
Dar rango de valores de las variables X e Y.
CUARTIL (Q1,Q2,Q3)
Hay que indicar el Rango de valores de la variable, y el número del cuartil que se busca:
1,2,3.
CURTOSIS
(g2)
Rango de valores de la variable.
DESVESTP (Sx)
Rango de valores de la variable.
DESVIA2
(Media de desviaciones respecto a la media al cuadrado) Rango de valores
de
la variable.
DESVPROM
(Media de valores absolutos de desviaciones respecto a la media al cuadrado). Rango de valores de la variable.
ESTIMACION.LINEAL
(Recta de
regresión).
Conocido_y es el rango
de valores de la variable dependiente. Conocido_x es el rango
de valores de la variable independiente.
Constante, es un valor lógico, de forma que si se pone verdadero, calcular
la recta y=a+bx,
si se pone falso calculará y=bx.
Estadística, también es
un valor lógico, lo dejaremos en
falso.
La peculiaridad de esta función
es que la salida es un conjunto
de celdas, una matriz (Valores de la ordenada
en origen y la pendiente).
Para visualizar toda la salida habrá que: Marcar con el ratón dos celdas, pulsar la tecla de funciones F2 y pulsar
a continuación y al mismo tiempo las teclas Control+Shift+Intro. El primer
valor, corresponde a la pendiente y el segundo
a la ordenada en el origen.
ESTIMACION.LOGARITMICA
(Ajuste no lineal).
Similar a la estimación lineal, pero la función que se ajusta es y=abx. Se obtienen
los valores del coeficiente
b en primer lugar y a en segundo lugar.
FRECUENCIA
(Distribución de frecuencias). El argumento
Datos, es el rango de valores de la variable. El argumento
Grupos, son los extremos
superiores del intervalo. EL resultado de la función
también es una matriz, y por tanto habrá que usar la opción de marcar el rango de celdas que tiene la matriz, pulsar la tecla de funciones F2 y pulsar a continuación y al mismo tiempo las
teclas Control+Shift+Intro.
MAX
(Valor máximo) Rango de valores de la variable.
MEDIA.ACOTADA
(Media de valores centrales) El argumento
Matriz, es el rango de valores
de la variable. El argumento
porcentaje es el % de valores
que se excluyen. Si se pone 0,1 calcula la media aritmética del 90% de valores centrales. (quitando
el 5% más altos y el 5% más bajos).
MEDIA.ARMO
(Media armónica) Rango de valores de la variable.
MEDIA.GEOM
(Media geométrica) Rango de valores de la
variable.
MEDIANA
Rango de valores de la variable.
MIN
(Mínimo valor)
Rango de valores
de la variable.
MODA
Rango de valores de la variable.
NORMALIZACION
(Calcula valores
tipificados). Habrá que darle como argumentos el valor de la variable
y su correspondiente media y desviación típica.
PERCENTIL
Los argumentos son: Matriz, que es el rango de valores de la variable, y K que es el percentil
que se busca. Si se desea el percentil 10, K valdrá 0,1. Si se desea el percentil
90, K vale 0,9.
PROMEDIO
(Media aritmética) Rango de valores de la variable.
PRONOSTICO
(Predicción a partir de la recta de regresión). Suponiendo que se conoce el valor de X, qué valor tomará Y según la recta de regresión. Los argumentos son: X que es el valor que toma la variable independiente, Conocido_X, que es el rango de valores
de la variable
X, y Conocido_Y, que es el rango de valores de la variable Y.
VARP
(Varianza) Rango
de valores de la variable.
USO DE LA HERRAMIENTA ANALIZAR DATOS.
Es un complemento que no suele instalarse por defecto. Si en el menú Herramientas no aparece; habrá que instalarlo. El proceso sería: Herramienta + Complementos + Análisis
de Datos. (Es posible que
pida el disco de instalación del
Office).
Una vez instalada, permite llevar a cabo análisis estadísticos básicos como:
El procedimiento para realizar
dichos análisis es rellenar los cuadros de diálogo.
Habrá que señalar
el rango de entrada, indicarle
si está en filas o columnas
y si la primera
celda corresponde al rótulo de la variable
o no. Habrá que señalar
también el rango
de salida, y seleccionar la opción resumen de estadísticas.
En este caso habrá que señalar el rango de entrada que contiene los valores de la
variable (se trata de distribuciones de frecuencias unitarias).
El rango de clases que es un conjunto de celdas donde se indican los extremos superiores del intervalo.
Pareto,
ordena las clases o intervalos por la frecuencia de los mismos.
Porcentaje acumulado calcula las frecuencias acumuladas.
Todo ello se puede representar gráficamente
marcando la opción crear gráfico.
Permite ajustar una recta de regresión a una
distribución bidimensional de
frecuencias. Rango Y: Variable
dependiente.
Rango X: Variable independiente.
Rótulos: Si se utilizan las primeras celdas
para el nombre de la variable.
Constante igual a
cero: Si se fuerza
a la recta a pasar por el origen de coordenadas. Habrá que dar rango de salida, y seleccionar las opciones de residuos,
gráfico de residuales y curva de regresión ajustada.
El objetivo
en este curso no es aprender
dominar el programa
Excel, sino utilizar Excel como
apoyo en los cálculos que requiere la Estadística Descriptiva.
Existe abundante bibliografía sobre el programa
informático Excel,
que puede resultar
de utilidad para el estudiante, y también
hay libros de ejercicios de estadística descriptiva
resueltos con Excel. (Véase bibliografía
en el programa de la asignatura).
No hay comentarios:
Publicar un comentario
deja tu comentario, es muy importante tu opinion