Mostrando entradas con la etiqueta Estadistica. Mostrar todas las entradas
Mostrando entradas con la etiqueta Estadistica. Mostrar todas las entradas

jueves, 9 de abril de 2015

Probabilidad Estadistica, historia y conceptos

¿Qué es la Probabilidad y la Estadística?
La Probabilidad y la Estadística se encargan del estudio del azar desde el punto de vista de las matemáticas:
  • La Probabilidad propone modelos para los fenómenos aleatorios, es decir, los que se pueden predecir con certeza, y estudia sus consecuencias lógicas.
  • La Estadística ofrece métodos y técnicas que permiten entender los datos a partir de modelos.
De esta manera, el Cálculo de las Probabilidades es una teoría matemática y la Estadística es una ciencia aplicada donde hay que dar un contenido concreto a la noción de probabilidad.
Probabilidad
En este sentido, el cálculo científico de probabilidades puede ayudarnos a comprender lo que en ocasiones la intuición nos indica de manera errónea. Un ejemplo típico es la denominada "paradoja de los cumpleaños". Supongamos que estamos en un grupo de 23 personas. Los cálculos nos dicen que la probabilidad de que dos personas celebren el mismo día su cumpleaños es del 50%, algo que a simple vista parece increíble (Paradoja del Cumpleaños »). No es de extrañar por tanto que la Teoría de Probabilidad se utilice en campos tan diversos como la demografía, la medicina, las comunicaciones, la informática, la economía y las finanzas.
Estadística
Cuando hablamos de estadística, se suele pensar en un conjunto de datos numéricos presentada de forma ordenada y sistemática. Esta idea es debida a la influencia de nuestro entorno, ya que hoy día es casi imposible que cualquier medio de communicación, periódico, radio, televisión, etc, no nos aborde diariamente con cualquier tipo de información estadística.
Sólo cuando nos adentramos en un mundo más específico como es el campo de la investigación de las Ciencias Sociales: Medicina, Biología, Psicología, ... empezamos a percibir que la Estadística no sólo es algo más, sino que se convierte en la única herramienta que, hoy por hoy, permite dar luz y obtener resultados, y por tanto beneficios, en cualquier tipo de estudio, cuyos movimientos y relaciones, por su variabilidad intrínseca, no puedan ser abordadas desde la perspectiva de las leyes determistas.
La Estadística se ocupa de los métodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y analizar los datos (Estadística Descriptiva), siempre y cuando la variabilidad e incertidumbre sea una causa intrínseca de los mismos; así como de realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones ( Estadística Inferencial)
En cuanto al concepto en sí, la probabilidad y el azar siempre ha estado en la mente del ser humano. Por ejemplo:
  • Sumerios y Asirios utilizaban un hueso extraído del talón de animales como ovejas, ciervos o caballos, denominado astrágalo o talus, que tallaban para que pudieran caer en cuatro posiciones distintas, por lo que son considerados como los precursores de los dados.
  • En el caso de la civilización egipcia, algunas pinturas encontradas en las tumbas de los faraones muestran tanto astrágalos como tableros para el registro de los resultados.
  • Por su parte, los juegos con dados se practicaron ininterrumpidamente desde los tiempos del Imperio Romano hasta el Renacimiento, aunque no se conoce apenas las reglas con las que jugaban. Uno de estos juegos, denominado "hazard", palabra que en inglés y francés significa riesgo o peligro, fue introducido en Europa con la Tercera Cruzada. Las raíces etimológicas del término provienen de la palabra árabe "al-azar", que significa "dado". Posteriormente, en el "Purgatorio" de Dante el término aparece ya como "azar".
  • En la actualidad, ruletas, máquinas tragaperras, loterías, quinielas,..., nos indican que dicha fascinación del hombre por el juego, continúa. 
Historia de la Probabilidad:

La historia de la probabilidad comienza en el siglo XVII cuando Pierre Fermat » y Blaise Pascal » tratan de resolver algunos problemas relacionados con los juegos de azar. Aunque algunos marcan sus inicios cuando Cardano (jugador donde los haya) escribió sobre 1520 El Libro de los Juegos de Azar (aunque no fué publicado hasta más de un siglo después, sobre 1660) no es hasta dicha fecha que comienza a elaborarse una teoría aceptable sobre los juegos.
Christian Huygens conoció la correspondencia entre Blaise Pascal y Pierre Fermat suscitada por el caballero De Méré, se planteó el debate de determinar la probabilidad de ganar una partida, y publicó (en 1657) el primer libro sobre probabilidad: De Ratiociniis in Ludo Aleae, (Calculating in Games of Chance), un tratado sobre juegos de azar.Se aceptaba como intuitivo el concepto de equiprobabilidad, se admitía que la probabilidad de conseguir un acontecimiento fuese igual al cociente entre
Durante el siglo XVIII, debido muy particularmente a la popularidad de los juegos de azar, el cálculo de probabilidades tuvo un notable desarrollo sobre la base de la anterior definición de probabilidad. Destacan en 1713 el teorema de Bernoulli y la distribución binomial, y en 1738 el primer caso particular estudiado por De Moivre » , del teorema central del límite. En 1809 Gauss » inició el estudio de la teoría de errores y en 1810 Laplace, que había considerado anteriormente el tema, completó el desarrollo de esta teoría. En 1812 Pierre Laplace » publicó Théorie analytique des probabilités en el que expone un análisis matemático sobre los juegos de azar.
A mediados del siglo  XIX, un fraile agustino austríaco, Gregor Mendel, inició el estudio de la herencia, la genética, con sus interesantes experimentos sobre el cruce de plantas de diferentes características. Su obra, La matemática de la Herencia, fue una de las primeras aplicaciones importantes de la teoría de probabilidad a las ciencias naturales
Desde los orígenes la principal dificultad para poder considerar la probabilidad como una rama de la matemática fue la elaboración de una teoría suficientemente precisa como para que fuese aceptada como una forma de matemática. A principios del siglo XX el matemático ruso Andrei Kolmogorov » la definió de forma axiomática y estableció las bases para la moderna teoría de la probabilidad que en la actualidad es parte de una teoría más amplia como es la teoría de la medida.
Historia de la Estadística
La palabra Estadística procede del vocablo “Estado”, pues era función principal de los Gobiernos de los Estados establecer registros de población, nacimientos, defunciones, impuestos, cosechas... La necesidad de poseer datos cifrados sobre la población y sus condiciones materiales de existencia han debido hacerse sentir desde que se establecieron sociedades humanas organizadas.
Es difícil conocer los orígenes de la Estadística. Desde los comienzos de la civilización han existido formas sencillas de estadística, pues ya se utilizaban representaciones gráficas y otros símbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el número de personas, animales o ciertas cosas.
  • Su origen empieza posiblemente en la isla de Cerdeña, donde existen monumentos prehistóricos pertenecientes a los Nuragas, las primeros habitantes de la isla; estos monumentos constan de bloques de basalto superpuestos sin mortero y en cuyas paredes de encontraban grabados toscos signos que han sido interpretados con mucha verosimilidad como muescas que servían para llevar la cuenta del ganado y la caza.
  • Hacia el año 3.000 a.C. los babilonios usaban ya pequeñas tablillas de arcilla para recopilar datos en tablas sobre la producción agrícola y los géneros vendidos o cambiados mediante trueque.
  • Los egipcios ya analizaban los datos de la población y la renta del país mucho antes de construir la pirámides.En los antiguos monumentos egipcios se encontraron interesantes documentos en que demuestran la sabia organización y administración de este pueblo; ellos llevaban cuenta de los movimientos poblacionales y continuamente hacían censos. Tal era su dedicación por llevar simpre una relación de todo que hasta tenían a la diosa Safnkit, diosa de los libros y las cuentas. Todo esto era hecho bajo la dirección del Faraón y fue a partir del año 3050 a.C.
  • En la Biblia observamos en uno de los libros del Pentateuco, bajo el nombre de Números, el censo que realizó Moisés después de la salida de Egipto. Textualmente dice: "Censo de las tribus: El día primero del segundo año después de la salida de Egipto, habló Yavpe a Moisés en el desierto de Sinaí en el tabernáculo de la reunión, diciendo: "Haz un censo general de toda la asamblea de los hijos de Israel, por familias y por linajes, describiendo por cabezas los nombres de todos los varones aptos para el servicio de armas en Israel. En el llibro bíblico Crónicas describe el bienestar material de las diversas tribus judías.
  • En China existían los censos chinos ordenados por el emperador Tao hacia el año 2.200 a.C.
  • Posteriormente, hacia el año 500 a.C., se realizaron censos en Roma para conocer la población existente en aquel momento. Se erigió la figura del censor, cuya misión consistía en controlar el número de habitantes y su distribución por los distintos territorios.
  • En la Edad Media, en el año 762, Carlomagno ordenó la creación de un registro de todas sus propiedades, así como de los bienes de la iglesia.
  • Después de la conquista normanda de Inglaterra en 1.066, el rey Guillermo I, el Conquistador, elaboró un catastro que puede considerarse el primero de Europa.
  • Los Reyes Católicos ordenaron a Alonso de Quintanilla en 1.482 el recuento de fuegos (hogares) de las provincias de Castilla.
En 1.662 un mercader de lencería londinense, John Graunt, publicó un tratado con las observaciones políticas y naturales, donde Graunt pone de manifiesto las cifras brutas de nacimientos y defunciones ocurridas en Londres durante el periodo 1.604-1.661, así como las influencias que ejercían las causas naturales, sociales y políticas de dichos acontecimientos. Puede considerarse el primer trabajo estadístico serio sobre la población.
Curiosamente, Graunt no conocía los trabajos de B. Pascal » (1.623-1.662) ni de C. Huygens (1.629-1.695) sobre estos mismos temas. Un poco más tarde, el astrónomo Edmund Halley (1.656- 1.742) presenta la primera tabla de mortalidad que se puede considerar como base de los estudios contemporáneos. En dicho trabajo se intenta establecer el precio de las anualidades a satisfacer a las compañías de seguros. Es decir, en Londres y en París se estaban construyendo, casi de manera simultánea, las dos disciplinas que actualmente llamamos estadística y probabilidad.
En el siglo XIX, la estadística entra en una nueva fase de su desarrollo con la generalización del método para estudiar fenómenos de las ciencias naturales y sociales. Galton » (1.822-1.911) y Pearson (1.857-1936) se pueden considerar como los padres de la estadística moderna, pues a ellos se debe el paso de la estadística deductiva a la estadística inductiva.
Los fundamentos de la estadística actual y muchos de los métodos de inferencia son debidos a R. A. Fisher. Se intereso primeramente por la eugenesia, lo que le conduce, siguiendo los pasos de Galton a la investigación estadística, sus trabajos culminan con la publicación de la obra Métodos estadísticos para investigaciones. En el aparece la metodología estadística tal y como hoy la conocemos.
A partir de mediados del siglo XX comienza lo que podemos denominar la estadística moderna, uno de los factores determinantes es la aparición y popularización de los computadores. El centro de gravedad de la metodología estadística se empieza a desplazar técnicas de computación intensiva aplicadas a grandes masas de datos, y se empieza a considerar el método estadístico como un proceso iterativo de búsqueda del modelo ideal
Las aplicaciones en este periodo de la Estadística a la Economía conducen a una disciplina con contenido propio: la Econometría. La investigación estadística en problemas militares durante la segunda guerra mundial y los nuevos métodos de programación matemática, dan lugar a la Investigación Operativa

jueves, 12 de marzo de 2015

Las Medidas de Dispersión

MEDIDAS DE DISPERSIÓN:
  1. Breve Introducción
  2. Rango
  3. Concepto de desviación
  4. Desviación Media
  5. Varianza
  6. Desviación Típica
  7. Cuasivarianza
  8. Cuasi Desviación típica
  9. Coeficiente de Variación
  10. Ejemplo


Breve Introducción
Hasta el momento hemos estudiado los valores centrales de la distribución, pero también es importante conocer si los valores en general están cerca o alejados de estos valores centrales, es por lo que surge la necesidad de estudiar medidas de dispersión.
Rango:

Es la primera medida que vamos a estudiar, se define como la diferencia existente entre el valor mayor y el menor de la distribución,. Lo notaremos como R. Realmente no es una medida muy significativa e la mayoría de los casos, pero indudablemente es muy fácil de calcular.  
Hemos estudiado varias medidas de centralización, por lo que podemos hablar de desviación con respecto a cualquiera de ellas, sin embargo, la mas utilizada es con respecto a la media.
Desviación: Es la diferencia que se observa entre el valor de la variable y la media aritmética. La denotaremos por di .
No es una medida, son muchas medidas, pues cada valor de la variable lleva asociada su correspondiente desviación, por lo que precisaremos una medida que resuma dicha información.

La primera solución puede ser calcular la media de todas las desviaciones, es decir, si consideramos como muestra la de todas las desviaciones y calculamos su media. Pero esta solución es mala pues como veremos siempre va a ser 0.

Luego por lo tanto esta primera idea no es valida, pues las desviaciones positivas se contrarrestan con las negativas.
Para resolver este problema, tenemos dos caminos:
Desviación media:
Es la media de los valores absolutos de las desviaciones, y la denotaremos por dm.
Varianza:
Es la media de los cuadrados de las desviaciones, y la denotaremos por o también por .
Aunque también es posible calcularlo como:

Este estadístico tiene el inconveniente de ser poco significativo, pues se mide en el cuadrado de la unidad de la variable, por ejemplo, si la variable viene dada en cm. La varianza vendrá en cm2.


Desviación típica:
Es la raíz cuadrada de la varianza, se denota por Sx o s x.
 
Este estadístico se mide en la misma unidad que la variable por lo que se puede interpretar mejor.
Otros dos estadísticos importantes son la cuasivarianza y la cuasidesviación típica, que como veremos cuando estudiemos el tema de estimación estadística, son los estimadores de la varianza y desviación típica poblacionales respectivamente.
Cuasivarianza:
Es una medida de dispersión, cuya única diferencia con la varianza es que dividimos por N-1, la representaremos por o y la calcularemos de la siguiente forma:
Cuasidesviación típica:
La raíz cuadrada de la cuasivarianza y la denotaremos por SN—1 o s N-1.
Todas estas medidas de dispersión vienen influidas por la unidad en la que se mide la variable, esto implica que si cambiamos de unidad de medida, los valores de estos estadísticos se vean a su vez modificados. Además, no permite comparar por ejemplo, en un grupo de alumnos si los pesos o las alturas presentan mas dispersión. Pues no es posible comparar unidades de distinto tipo.
Precisamos por lo tanto, una medida "escalar", es decir, que no lleve asociado ninguna unidad de medida.
Coeficiente de Variación:
Es un estadístico de dispersión que tiene la ventaja de que no lleva asociada ninguna unidad, por lo que nos permitirá decir entre dos muestras, cual es la que presenta mayor dispersión. La denotaremos por C.V.
Ejemplo
Veamos por último un ejemplo de cómo se calculan todas estas medidas.

45
55
6
6
50
300
-19,4
116,4
2258,16
15000
55
65
10
16
60
600
-9,4
94
883,6
36000
65
75
19
35
70
1330
0,6
11,4
6,84
93100
75
85
11
46
80
880
10,6
116,6
1235,96
70400
85
95
4
50
90
360
20,6
82,4
1697,44
32400

N=
50


3470

420,8
6082
246900
=
Dm=
=

C.V.=

jueves, 5 de marzo de 2015

GUIA DE MANEJO DE EXCEL PARA LA ASIGNATURA ESTADÍSTICA DESCRIPTIVA



















GUIA DE MANEJO DE EXCEL PARA LA ASIGNATURA ESTADÍSTICA DESCRIPTIVA





Proyecto Piloto ECTS


CURSO 2006/07


MANEJO    DE    LA    HOJA    DE    CALCULO    EXCEL    PARA    ANÁLISIS DESCRIPTIVO Y EXPLORATORIO DE DATOS.


INTRODUCCIÓN A LA HOJA DE CALCULO.

Excel es una hoja de calculo que facilita los cálculos y la obtención de indicadores y estadísticos para estudiar el comportamiento de una o varias variables.

Se podría entender como una matriz de filas y columnas. Cada combinación de fila y columna se denomina celda. Por ejemplo la celda A1, B33, Z68.

Un conjunto de celdas se denomina rango, y en Excel se expresa como A1:B4. En cada celda se puede recoger:
-          rótulo
-          número
-          fórmula

Como su nombre indica, la hoja de cálculo nos permite calcular, hacer operaciones matemáticas, lógicas, estadísticas, financieras, etc..

Con la hoja de cálculo EXCEL (u otras similares) se pueden obtener fácilmente estadísticos y medidas que resuman y caractericen una variable, una distribución de frecuencias, o una distribución bidimensional (n-dimensional) de frecuencias, es decir varias variables conjuntamente.

La primera pantalla que aparece en Excel es la siguiente:





Un primer recorrido por la hoja de cálculo nos permite conocer las:
-          opciones de menú
-          barra de herramientas
-          barra de estado.....

Podemos utilizar la hoja de cálculo:

1.- Para obtener representaciones gráficas según el tipo de variable
2.- Para ir haciendo los cálculos necesarios para obtener los distintos estadísticos (media, mediana, moda, cuantiles, varianzas, g1, etc). A partir de unos datos (o de una distribución de frecuencias) hacemos los cálculos necesarios para desarrollar una fórmula y paso a paso calcular hasta obtener el resultado final. (Sumas, productos, divisiones, potencias, raíces, etc…)
3.- Para obtener fácilmente estadísticos como promedios, varianzas, cuartiles, covarianzas, regresión, etc.., aplicando una lista de  funciones  previamente programadas en la hoja de cálculo. (Insertar + funciones o el símbolo fx de los botones de las barras de herramientas). (Ver listado de funciones y argumentos que requieren)
4.- Para analizar un conjunto de información. Se usará en el menú de Herramientas la opción Analizar Datos. Permite describir un conjunto de información correspondiente a una o varias variables. Los datos de entrada son con frecuencia unitaria ( si un valor se repite varias veces aparece repetido ese número de veces). También permite aplicar técnicas estadísticas más sofisticadas (regresión, contrastes de hipótesis, estimación por intervalos, etc...).


REPRESENTACIONES GRÁFICAS:


Insertar gráfico, o el icono correspondiente a gráficos, y seguimos los pasos que nos sugiere el asistente para gráficos:

Elegir tipo de gráfico Definir rango de datos
Etiquetar ejes y gráfico, leyenda, etc..
Decidir dónde se ha de representar el gráfico (en la hoja, en hoja nueva, etc...)

Para cada variable, según sus propiedades de medida, elegimos uno o varios gráficos según los aspectos o detalles que queramos resaltar.


Variables cualitativas: Barras, circular,  columnas, anillos, ..
Variables cuantitativas: Histograma (que aparece en Herramientas Analizar Datos) 2 variables cuantitativas: Dispersión XY
2 variables cualitativas: columnas en espacio tridimensional (xi, yj, nij) Listado de gráficos tipo estándar
Listado de gráficos personalizados.

Una vez obtenido el gráfico, luego se puede editar y cambiar los aspectos de formato que nos interese: (rótulos, colores, rejillas, escalas, etc...). Incluso se le pueden añadir rótulos de textos, flechas o figuras, etc...


EXCEL PARA ANALIZAR DATOS CALCULANDO LAS  FORMULAS


La mecánica es similar al procedimiento que utilizamos para resolver problemas de estadística utilizando una calculadora. Es importante rotular y disponer de manera clara y ordenada los cálculos. Esto facilita su posterior uso e incluso la revisión de los procedimientos si se detectan errores.
Como ya se ha indicado, una celda puede contener un rótulo, un número o una fórmula. Para crear una fórmula empezamos tecleando en una celda, por ejemplo la C1,   el
símbolo “=”, y la operación que deseamos realizar. Puede ser un simple cálculo matemático: =7+5, y nos da un resultado 12. Pero puede ser una fórmula =A1+B1. Si en la celda A1 hay un 7 y en la B1 un 3, aparecerá el mismo resultado 12, sin embargo ya no es un número, sino una fórmula. Esto tiene dos implicaciones importantes:
1.- Si cambian los valores de las celdas A1 y B1, cambia el resultado en C1 obteniendo la suma de los nuevos números.
2.- Cuando copio la celda C1 a otra celda, no copio el valor, sino la fórmula. Aunque aparentemente a la vista sólo veamos un número en la celda, al copiar esa celda lo que copio no es el resultado, sino la fórmula. Al copiar, cuando nos desplazarnos hacia la derecha-izquierda (por columnas manteniéndonos en la misma fila) en la hoja de cálculo, la fórmula se desplaza en “letras”. Sin embargo, cuando nos desplazarnos hacia la arriba-abajo (por filas manteniéndonos en la misma columna) en la hoja de cálculo, la fórmula se desplaza en “números”.

Podemos indicarle en la fórmula que mantenga fijo la fila, la columna o ambas. Para ello deberemos anteponer el símbolo $ antes de la letra (columna), o antes del número (fila) o antes de las dos (fila y columna, es decir celda) de la identificación de la celda.

Algunas de las operaciones matemáticas que puede hacer son: Suma = ..+..
División =.. /..
Elevar al cuadrado =..^2 Elevar a potencia n =..^n Raiz =raiz(..)
Calcular valor absoluto =abs(..) Calcular raíz n-esima=... ^(1/n) Calcular logaritmos =LN(..) Etc..
Sumar un rango de valores con la autosuma (=suma(..), ó símbolo )

Con ello se puede calcular:
Fi, fi, Ni, N, xini,  m2, m3, g1, g2, Sxy, rxy, tasas variación, etc....)

Conviene, en la medida de lo posible, formular los cálculos indicando la posición dentro de la hoja (celdas) y no los valores (números). Eso nos permitirá hacer ejemplos similares con muy poco esfuerzo, cambiando sólo los datos de partida y aprovechando toda la estructura de cálculos a partir de ellos.


CALCULOS EN EXCEL APLICANDO FUNCIONES.


Para poder aplicar funciones fx las frecuencias han de ser unitarias. Es decir cada valor estará repetido tantas veces como indique su frecuencia.
Una distribución de frecuencias como


Xi
ni
3
3
4
3
5
2
 2     
2   

Quedaría:
Xi       3 3 3 4 4 4 5 5 2 2

Usando las funciones podremos calcular: máximo y mínimo valor, recuento de frecuencias, promedios, cuantiles, mediana, moda, media armónica, geométrica, media recortada, varianza y desviación típica, medidas de forma, etc... También podemos calcular algunos estadísticos bidimensionales: covarianza, correlación, estimación lineal, estimación logarítmica, tendencia, pronóstico, etc.



En  el  menú  insertar,  seleccionar  la  opción  función,  seleccionar  la  categoría  de
Estadísticas y dentro de ellas la que interese.


A continuación habrá que rellenar el cuadro de diálogo. Por ejemplo:



La función promedio, permite calcular la media aritmética. Aparece en la parte inferior del cuadro de diálogo una breve descripción de la función, y permite solicitar más información sobre ella en Ayuda sobre esta función.

En este caso los argumentos de la función, lo que habría que rellenar en el cuadro de diálogo es el conjunto de celdas en los que se encuentras los valores de la variable.
En Número1 habrá que indicarle el rango de celdas, por ejemplo A1:A30, o pinchando en el recuadro que hay a la derecha, marcar con el ratón dichas celdas.


A continuación se ofrece una breve guía de las funciones, indicando su correspondencia con los estadísticos que se explican en clase y alguna información adicional sobre el significado de los argumentos de la función.

COEF.DE.CORREL (r).
Dar rango de valores de las variables X e Y.

COEFICIENTE.ASIMETRIA (g1).

Rango de valores de la variable.

COEFICIENTE.R2 (r2)
Dar rango de valores de las variables X e Y.

CONTAR

Rango de valores de la variable. Cuenta el número de valores.

CONTAR.SI

Especificar rango de valores de la variable y criterio. Por ejemplo número de veces que una variable se repite el 3. El criterio puede ser un número o una celda de la hoja de cálculo.


COVAR (Sxy)
Dar rango de valores de las variables X e Y.

CUARTIL (Q1,Q2,Q3)
Hay que indicar el Rango de valores de la variable, y el número del cuartil que se busca:
1,2,3.

CURTOSIS (g2)
Rango de valores de la variable.

DESVESTP (Sx)
Rango de valores de la variable.

DESVIA2

(Media  de  desviaciones  respecto  a  la  media  al  cuadrado)  Rango  de  valores  de  la variable.

DESVPROM

(Media de valores absolutos de desviaciones respecto a la media al cuadrado). Rango de valores de la variable.

ESTIMACION.LINEAL

(Recta de regresión).
Conocido_y es el rango de valores de la variable dependiente. Conocido_x es el rango de valores de la variable independiente.
Constante, es un valor lógico, de forma que si se pone verdadero, calcular la recta y=a+bx, si se pone falso calculará y=bx.
Estadística, también es un valor lógico, lo dejaremos en falso.
La peculiaridad de esta función es que la salida es un conjunto de celdas, una matriz (Valores de la ordenada en origen y la pendiente).
Para visualizar toda la salida habrá que: Marcar con el ratón dos celdas, pulsar la tecla de funciones F2 y pulsar a continuación y al mismo tiempo las teclas Control+Shift+Intro. El primer valor, corresponde a la pendiente y el segundo a la ordenada en el origen.

ESTIMACION.LOGARITMICA

(Ajuste no lineal). Similar a la estimación lineal, pero la función que se ajusta es y=abx. Se obtienen los valores del coeficiente b en primer lugar y a en segundo lugar.

FRECUENCIA

(Distribución de frecuencias). El argumento Datos, es el rango de valores de  la variable. El argumento Grupos, son los extremos superiores del intervalo. EL resultado de la función también es una matriz, y por tanto habrá que usar la opción de marcar el rango de celdas que tiene la matriz, pulsar la tecla de funciones F2 y pulsar a continuación y al mismo tiempo las teclas Control+Shift+Intro.

MAX

(Valor máximo) Rango de valores de la variable.


MEDIA.ACOTADA

(Media de valores centrales) El argumento Matriz, es el rango de valores de la variable. El argumento porcentaje es el % de valores que se excluyen. Si se pone 0,1 calcula la media aritmética del 90% de valores centrales. (quitando el 5% más altos y el 5% más bajos).

MEDIA.ARMO

(Media armónica) Rango de valores de la variable.

MEDIA.GEOM

(Media geométrica) Rango de valores de la variable.

MEDIANA

Rango de valores de la variable.

MIN

(Mínimo valor) Rango de valores de la variable.

MODA

Rango de valores de la variable.

NORMALIZACION

(Calcula valores tipificados). Habrá que darle como argumentos el valor de la variable y su correspondiente media y desviación típica.

PERCENTIL

Los argumentos son: Matriz, que es el rango de valores de la variable, y K que es el percentil que se busca. Si se desea el percentil 10, K valdrá 0,1. Si se desea el percentil 90, K vale 0,9.

PROMEDIO

(Media aritmética) Rango de valores de la variable.

PRONOSTICO

(Predicción a partir de la recta de regresión). Suponiendo que se conoce el valor de X, qué valor tomará Y según la recta de regresión. Los argumentos son: X que es el valor que toma la variable independiente, Conocido_X, que es el rango de valores de la variable X, y Conocido_Y, que es el rango de valores de la variable Y.

VARP

(Varianza) Rango de valores de la variable.


USO DE LA HERRAMIENTA ANALIZAR DATOS.


Es un complemento que no suele instalarse por defecto. Si en el menú Herramientas no aparece; habrá que instalarlo. El proceso sería: Herramienta + Complementos + Análisis de Datos. (Es posible que pida el disco de instalación del Office).


Una vez instalada, permite llevar a cabo análisis estadísticos básicos como:




El procedimiento para realizar dichos análisis es rellenar los cuadros de diálogo.



Habrá que señalar el rango de entrada, indicarle si está en filas o columnas y si la primera celda corresponde al rótulo de la variable o no. Habrá que señalar también el rango de salida, y seleccionar la opción resumen de estadísticas.


En este caso habrá que señalar el rango de entrada que contiene los valores de la variable (se trata de distribuciones de frecuencias unitarias).
El rango de clases que es un conjunto de celdas donde se indican los extremos superiores del intervalo.
Pareto, ordena las clases o intervalos por la frecuencia de los mismos. Porcentaje acumulado calcula las frecuencias acumuladas.
Todo ello se puede representar gráficamente marcando la opción crear gráfico.



Permite ajustar una recta de regresión a una distribución bidimensional de frecuencias. Rango Y: Variable dependiente.
Rango X: Variable independiente.
Rótulos: Si se utilizan las primeras celdas para el nombre de la variable.
Constante igual a cero: Si se fuerza a la recta a pasar por el origen de coordenadas. Habrá que dar rango de salida, y seleccionar las opciones de residuos, gráfico de residuales y curva de regresión ajustada.



El objetivo en este curso no es aprender dominar el programa Excel, sino utilizar Excel como apoyo en los cálculos que requiere la Estadística Descriptiva.
Existe abundante bibliografía sobre el programa informático Excel, que puede resultar de utilidad para el estudiante, y también hay libros de ejercicios de estadística descriptiva resueltos con Excel. (Véase bibliografía en el programa de la asignatura).