sábado, febrero 26

Kolmogorov-Smirnov


En esta prueba también se está interesado en el grado de concordancia entre la distribución de frecuencia muestral y la distribución de frecuencia teórica, bajo la hipótesis nula de que la distribución de la muestra es f0(x,q) e interesa probar que no existe diferencia significativa. La prueba trabaja con la función de distribución ( distribución de frecuencia acumulativa). Esta prueba pertenece al campo de la Estadística No Paramétrica.
Sea F0(x) la función de distribución teórica para la variable aleatoria X, y representa la probabilidad de que la variable aleatoria X tome un valor menor o igual a x (también se interpreta como la proporción esperada de observaciones que tengan un valor menor o igual a x). Es decir:
Sea Sn (x) la función de distribución empírica, calculada con base en los valores observados de la muestra n observaciones. Sn (x) representa la proporción de valores observados que son menores o iguales a x, y está definida como:
Sn (x) = P ( X £ x/ dados los resultados muestrales) = m/n
donde m es el número de valores observados que son menores o iguales a x.
En la prueba de Smirnov-Kolmogorov se está interesado en la mayor desviación entre la función de distribución teórica y la empírica, es decir entre F0 (x) y Sn(x), para todo el rango de valores de x. Bajo la hipótesis nula se espera que estas desviaciones sean pequeñas y estén dentro de los límites de errores aleatorios. Por lo tanto, en la prueba S-K se calcula la mayor desviación existente entre F0 (x) y Sn(x), denotada por Dmax(x) y está dada por:
Dmax(x) = Max | FX (x) - Sn (x) |


Los pasos para realizar Smirnov-Kolmogorov son:
1- Se plantea una  Ho, hipótesis nula. y Ha, hipótesis alternativa
2- Se extraen de la muestra las variables necesarias para realizar la prueba,  como :media, desviación, rango (limsup – liminf), numero de datos que se tomaran de la muestra, numero de intervalos y tamaño del intervalo.

3- Se calcula la frecuencia observada de cada uno de los intervalos, al final la suma de las frecuencias observadas debe ser igual a 100.
4- Calculamos la frecuencia observada relativa con la formula: frecuencia observada de cada intervalo/la sumatoria total de la frecuencia observada.
5- Luego calculamos la frecuencia observada relativa acumulada y frecuencia esperada relativa acumulada, esta ultima varía de acuerdo al tipo de histograma que nos haya dado.
6- aplicamos la formula
D = (FOR Acum - FER Acum) el cual es el estadístico de prueba; donde la D que mayor valor de va a ser la mayor discrepancia o estimador de kolmogorov.
7- Se hallan también los grados de libertad de acuerdo a la distribución estadística utilizada.
8- se busca en la tabla de acuerdo al tamaño de la muestra y un  determinado valor de riesgo alfa (α),
9-  se busca en la tabla de smirnov kolmogorov, si el estimador de la prueba (D) es menor que el valor que se encontró en la tabla entonces se acepta la hipótesis Ho (hipótesis nula) planteada antes de estudiar la muestra, de lo contrario se acepta la hipótesis alternativa Ha.


tabla :








Bibliografia: Cao Abad Ricardo; Introducción a la Simulación y a la Teoría de Colas.

No hay comentarios:

Publicar un comentario