La desviación estándar en el análisis estadístico, generalmente denotada como S, es una estimación de la varianza o dispersión (que se refiere al grado de compresión o estiramiento) en relación con distribuciones normales u otros valores. De hecho, una desviación estándar más alta significa un rango más amplio de valores promedio, así como un número menor de valores atípicos.

La desviación estándar se puede utilizar para proporcionar información sobre la distribución de una variable.

Algunas distribuciones comunes utilizadas en el análisis estadístico son datos distribuidos normalmente y datos gaussianos. Por lo general, cuando los datos se distribuyen normalmente, los datos se distribuyen aleatoriamente. La desviación estándar estima la distancia entre los valores.

Si se conoce el valor medio de los datos, la distribución ha sido aleatoria; no existe una relación sistemática. Pero si no es así, la probabilidad de que el valor medio esté dentro del rango de valores medios es inferior al cinco por ciento.

Para distribuciones aleatorias, la probabilidad de que la distribución sea aleatoria es proporcional a la raíz cuadrada de la desviación de la media. Si un dato se extiende demasiado en todas las direcciones, es muy poco probable que la media esté en el centro de la distribución. Si los datos están muy agrupados, entonces la probabilidad de que la media se encuentre dentro del rango de valores medios también es menor al cinco por ciento.

desviacion estandar

La estadística de variables aleatorias

La estadística de variables aleatorias tiene un significado diferente para los estudiantes de estadística. Debido a que utilizan datos aleatorios, solo pueden interpretar los resultados como basados ​​en un muestreo aleatorio. Pero aún deben comprender que no existe una prueba científica que pueda probar o refutar la existencia de la distribución aleatoria o la precisión de su muestreo aleatorio.

Otro tipo de variable aleatoria es la gaussiana, que tiene desviaciones estándar más altas que las variables aleatorias descritas anteriormente. Una distribución gaussiana, como una distribución normal, tiene un rango central, llamado media y desviación estándar, y un rango externo.

A medida que la distribución se vuelve más aleatoria, las áreas internas se vuelven más pequeñas y las áreas externas se vuelven más grandes, lo que da como resultado una alta probabilidad de que cualquier dato en cualquier intervalo caiga dentro del área central.

Resultados del análisis estadístico

Los resultados del análisis estadístico se pueden estimar utilizando las fórmulas. Algunos de los métodos más utilizados incluyen: media geométrica, varianza geométrica, desviación cuadrática media y error estándar. (SEM) e intervalos de confianza.

La media geométrica se puede derivar tomando la media y dividiendo por la desviación estándar; la varianza geométrica se puede derivar tomando la media geométrica dividida por la desviación estándar. y el error estándar se puede derivar tomando la desviación estándar y dividiendo por la media geométrica.

La media geométrica se usa comúnmente para comparar y contrastar varios tipos de datos para determinar si son significativamente diferentes. Este tipo de estadística no requiere un conocimiento previo de la distribución utilizada. La media geométrica es a menudo una prueba más simple que las otras y requiere relativamente pocos cálculos.

La media geométrica es útil para evaluar la consistencia de las tendencias en un conjunto de datos, lo cual es relevante en el análisis de datos de ventas o marketing, donde los conjuntos de datos son relativamente consistentes a lo largo del tiempo.

La varianza geométrica a veces se conoce como la diferencia media entre los datos con respecto a su media geométrica y se utiliza en análisis de correlación y regresión. El error estándar se utiliza en la estimación de la desviación estándar.

Debido a la naturaleza matemática de la varianza geométrica y el error estándar, un estudiante debe tener cierta experiencia en cálculo. Otros cursos de estadística también proporcionan algunos antecedentes en este tipo de estadísticas.

Problemas al utilizar la desviación estadística

Uno de los mayores problemas que se encuentran al utilizar la desviación estadística es el manejo de datos faltantes. Los datos que necesita para la significación estadística normalmente están disponibles en los encuestados. Si no incluye estos datos en su análisis, no podrá determinar la significación estadística.

Hay algunos principios generales que se pueden utilizar para corregir este problema, como: tomar la media, dividir por la media y luego restar un punto de la media y dividir la diferencia por la desviación estándar.

Al analizar los datos que faltan, lo más importante es determinar el tamaño medio de la muestra, que es el número de puntos utilizados para determinar la significancia estadística. Aunque esta información puede no estar disponible para el encuestado, se requiere en muchos otros análisis.

Author