x
1

Varianza



En teoría de probabilidad, la varianza o variancia (que suele representarse como ) de una variable aleatoria es una medida de dispersión definida como la esperanza del cuadrado de la desviación de dicha variable respecto a su media. Su unidad de medida corresponde al cuadrado de la unidad de medida de la variable: por ejemplo, si la variable mide una distancia en metros, la varianza se expresa en metros al cuadrado. La varianza tiene como valor mínimo 0. La desviación estándar (raíz cuadrada positiva de la varianza) es una medida de dispersión alternativa, expresada en las mismas unidades que los datos de la variable objeto de estudio.

Hay que tener en cuenta que la varianza puede verse muy influida por los valores atípicos y no se aconseja su uso cuando las distribuciones de las variables aleatorias tienen colas pesadas. En tales casos se recomienda el uso de otras medidas de dispersión más robustas.

El término varianza fue acuñado por Ronald Fisher en un artículo publicado en enero de 1919 con el título The Correlation Between Relatives on the Supposition of Mendelian Inheritance.[1]

A continuación se hará un repaso de las fórmulas, hay que tener en cuenta que la fórmula de la varianza para una población (σ2) difiere de la fórmula de la varianza para una muestra (s2), Pero antes de ver la fórmula de la varianza, debemos decir que la varianza en estadística es muy importante. Ya que aunque se trata de una medida sencilla, puede aportar mucha información sobre una variable en concreto.

La unidad de medida de la varianza será siempre la unidad de medida correspondiente a los datos pero elevada al cuadrado. La varianza siempre es mayor o igual que cero. Al elevarse los residuos al cuadrado es matemáticamente imposible que la varianza salga negativa. Y de esa forma no puede ser menor que cero.

Sea una variable aleatoria con media , se define la varianza de la variable aleatoria , denotada por , o simplemente como

Desarrollando la definición anterior, se obtiene la siguiente definición alternativa (y equivalente):

Si una distribución no tiene esperanza, como ocurre con la de Cauchy, tampoco tiene varianza. Existen otras distribuciones que, aun teniendo esperanza, carecen de varianza. Un ejemplo de ellas es la de Pareto cuando su índice satisface .

Si la variable aleatoria es continua con función de densidad entonces

donde

y las integrales están definidas sobre el soporte de la variable aleatoria , es decir, .

Si la variable aleatoria es discreta con función de probabilidad entonces

donde

Sean y dos variables aleatorias con varianza finita y

Vamos a darles los valores Cara = 0 y Escudo = 1 y tenemos una variable aleatoria "X":

Usando notación matemática:

X = {0, 1}

Nota: ¡Podríamos elegir Cara = 100 y Escudo = 150 u otros valores si queremos! Es nuestra elección. Entonces:

Si una variable aleatoria continua tiene una distribución exponencial con parámetro entonces su función de densidad está dada por

para .

No es difícil ver que la media de es , por lo que para hallar su varianza calculamos

Después de integrar se puede concluir que

Un dado de seis caras puede representarse como una variable aleatoria discreta que toma, valores del 1 al 6 con probabilidad igual a 1/6. El valor esperado es (1+2+3+4+5+6)/6 = 3,5. Por lo tanto, su varianza es:

En muchas situaciones es preciso estimar la varianza poblacional a partir de una muestra. Si se toma una muestra con reemplazo de valores de ella, de entre todos los estimadores posibles de la varianza de la población de partida, existen dos de uso corriente

El primero de ellos

que puede ser escrito como

pues

y el segundo de ellos es

que puede ser escrito como

pues

A ambos se los denomina varianza muestral, difieren ligeramente y, para valores grandes de , la diferencia es irrelevante. El primero traslada directamente la varianza de la muestra al de la población y el segundo es un estimador insesgado de la varianza poblacional pues

mientras que

Como consecuencia de la igualdad , es un estadístico insesgado de . Además, si se cumplen las condiciones necesarias para la ley de los grandes números, s2 es un estimador consistente de .

Más aún, cuando las muestras siguen una distribución normal, por el teorema de Cochran, tiene la distribución chi-cuadrado:

Dejamos tres fórmulas equivalentes para el cálculo de la varianza muestral

Esta última igualdad tiene interés para interpretar los estimadores y , pues si se quiere evaluar la desviación de unos datos o sus diferencias, se puede optar por calcular el promedio de los cuadrados de las diferencias de cada par de datos:

O se puede considerar el promedio de los cuadrados de las diferencias de cada par de datos sin tener en cuenta cada dato consigo mismo, ahora el número de sumandos es .

Las aplicaciones estadísticas del concepto de la varianza son incontables. Las siguientes son solo algunas de las principales:

En el análisis de varianzas se estudian las diferencias significativas entre dos o más medias de una muestra. Este análisis se conoce comúnmente como ANOVA y nos permite determinar también si esas medias provienen de una misma población (puede ser el número total de empleados de una empresa), o si las medias de dos poblaciones son iguales.

Por otro lado, la varianza al igual que la desviación estándar son muy sensibles a los valores atípicos, estos son los valores que se alejan mucho de la media o que son muy distintos a esta.

Para que estas medidas no se vean tan afectadas, estos valores atípicos pueden obviarse a la hora de realizar los análisis e incluso los cálculos. También pueden emplearse otras medidas de dispersión que son más útiles en estos casos.

En el caso de analizar el riesgo de una inversión, se tienen en cuenta dos aspectos importantes, uno es el rendimiento invertido y otro el esperado de acuerdo a la inversión realizada. Como ya se mencionó, se puede utilizar la varianza para analizar este riesgo.



Escribe un comentario o lo que quieras sobre Varianza (directo, no tienes que registrarte)


Comentarios
(de más nuevos a más antiguos)


Aún no hay comentarios, ¡deja el primero!