Glosario Términos estadísticos / Término
Es la descripción de la proporción de observaciones que se encuentran alrededor de la media, en unidades de desviaciones estándar, siempre que la distribución de frecuencias sea aproximadamente simétrica.
La regla empírica es el resultado de la experiencia práctica de investigadores en muchas disciplinas, que han observado muy diferentes tipos de conjuntos de datos de la vida real.
La regla empírica, a la que también se le conoce como la regla 68,5-95-99,7, constituye una manera útil de analizar datos estadísticos. Sin embargo, solo funciona para una distribución normal (la campana de Gauss) y solo es posible producir estimaciones.
En una distribución normal (forma de campana), si tomamos una desviación estándar por ambos sentidos respecto del valor medio cubriríamos un espacio 68% de probabilidad de que ocurra un evento, por otro lado con 2 desviaciones estándar por ambos sentidos respecto a este valor medio tendríamos un espacio cubierto del 95 % finalmente con 3 desviaciones estándar tenemos un espacio que cubre un 99% de que ocurra un evento. La curva normal es asintótica lo que significa que no toca el eje de los x; se pierden centésimas hacia infinito y –infinito. Esto es la regla empírica, es decir, un valor medio más menos una desviación estándar cubriremos un 68 de probabilidad en una curva normal, un valor medio más menos 2 veces la desviación estándar cubrirá el 95% de esta curva y el valor medio más menos 3 veces la desviación estándar cubre casi 100 %de probabilidad en una curva normal. Finalmente para facilitar los cálculos cualquier valor real se puede convertir en la escala z donde se tienen una media de 0, se cubren los valores de -3 a 3.
Una de las ventajas del teorema de de Chebyshev es que se aplica a cualquier conjunto de datos, sin importar en que forma estén distribuidos; pero se ha visto en la práctica que si un conjunto de datos se distribuye, aproximadamente, en forma de campana es posible aplicar en ellos la llamada regla empirica de la desviación estándar.
Eesta regla permite encontrar el porcentaje de datos que debe estar dentro de determinadas desviaciones estándar respecto a la media. A continuación se determinan estos porcentajes:
1) Aproximadamente el 68% de los datos están a menos de una desviación estándar de la media.
2) Aproximadamente el 95% de los datos están a menos de dos desviaciones estándar de la media.
3) Casi todos los datos de la muestra están a tres desviaciones de la media.
El teorema de Chebyshev es muy importante, ya que permite determinar los límites de las probabilidades de variables aleatorias discretas o continuas sin tener que especificar sus funciones de probabilidad. Este teorema asegura que la probabilidad de que una variable aleatoria se aleje de la media no más de k desviaciones estándar, es menor o igual a 1/k2 para algún valor de k >1. Aunque la garantía no siempre es muy precisa, la ventaja sobre este teorema es su gran generalidad por cuanto es aplicable a cualquier variable aleatoria con cualquier distribución de probabilidad, ya sea discreta o continua.
La regla empírica ayuda a medir como se distribuyen los valores por encima y debajo de la media. Implica que, en las distribuciones con forma de campana, aproximadamente uno de cada 20 valores estará alejado de la media más allá de dos desviaciones estándar en cualquier dirección.
Enlace permanente: Regla empírica - Fecha de actualización: 2019-03-07 - Fecha de creación: 2017-08-08