Comment calculer la variance résiduelle

Table des matières:

Anonim

Les investisseurs utilisent des modèles d’évolution des prix des actifs pour prédire où se situera le prix d’un investissement à un moment donné. Les méthodes utilisées pour faire ces prévisions font partie d’un domaine de la statistique appelé analyse de régression. Le calcul de la variance résiduelle d’un ensemble de valeurs est un outil d’analyse de régression qui mesure la précision avec laquelle les prédictions du modèle correspondent aux valeurs réelles.

Ligne de régression

le ligne de régression montre comment la valeur de l'actif a changé en raison de changements dans différentes variables. Aussi connu comme un ligne de tendance, la ligne de régression affiche la "tendance" du prix de l'actif. La droite de régression est représentée par une équation linéaire:

Y = a + bX

où "Y" est la valeur de l'actif, "a" est une constante, "b" est un multiplicateur et "X" est une variable liée à la valeur de l'actif.

Par exemple, si le modèle prédit qu'une maison à une chambre se vend 300 000 $, une maison à deux chambres à 400 000 $ et une maison à trois chambres à 500 000 $, la ligne de régression ressemble à ceci:

Y = 200 000 + 100 000X

où "Y" représente le prix de vente de la maison et "X" le nombre de chambres à coucher.

Y = 200 000 + 100 000 (1) = 300 000

Y = 200 000 + 100 000 (2) = 400 000

Y = 200 000 + 100 000 (3) = 500 000

Nuage de points

UNE nuage de points montre les points qui représentent les corrélations réelles entre la valeur de l'actif et la variable. Le terme "diagramme de dispersion" vient du fait que, lorsque ces points sont tracés sur un graphique, ils semblent être "dispersés", plutôt que parfaitement alignés sur la droite de régression. En utilisant l'exemple ci-dessus, nous pourrions avoir un nuage de points avec ces points de données:

Point 1: 1BR vendu pour 288 000 $

Point 2: 1BR vendu pour 315 000 $

Point 3: 2BR vendu pour 395 000 $

Point 4: 2BR vendu pour 410 000 $

Point 5: 3BR vendu pour 492 000 $

Point 6: 3BR vendu pour 507 000 $

Calcul de la variance résiduelle

Le calcul de la variance résiduelle commence par le somme des carrés des différences entre la valeur de l'actif sur la ligne de régression et chaque valeur d'actif correspondante sur le diagramme de dispersion.

Les carrés des différences sont montrés ici:

Point 1: 288 000 dollars - 300 000 dollars = (- 12 000 dollars); (-12 000)2 = 144,000,000

Point 2: 315 000 dollars - 300 000 dollars = (+ 15 000 dollars); (+15 000)2 = 225,000,000

Point 3: 395 000 dollars - 400 000 dollars = (- 5 000 dollars); (-5 000)2 = 25,000,000

Point 4: 410 000 dollars - 400 000 dollars = (+ 10 000 dollars); (+10 000)2 = 100,000,000

Point 5: 492 000 dollars - 500 000 dollars = (- 8 000 dollars); (-8 000)2 = 64,000,000

Point 6: 507 000 dollars - 500 000 dollars = (+ 7 000 dollars); (+7 000)2 = 49,000,000

Somme des carrés = 607,000,000

La variance résiduelle est obtenue en prenant la somme des carrés et en la divisant par (n-2), où "n" est le nombre de points de données sur le diagramme de dispersion.

RV = 607 000 000 / (6-2) = 607 000 000/4 = 151 750 000.

Utilisations de la variance résiduelle

Bien que chaque point du diagramme de dispersion ne s'aligne pas parfaitement avec la droite de régression, un modèle stable aura les points du diagramme de dispersion selon une distribution régulière autour de la droite de régression. La variance résiduelle est également appelée "variance d'erreur". Une variance résiduelle élevée indique que la ligne de régression du modèle d'origine peut être erronée. Certaines fonctions de la feuille de calcul peuvent montrer le processus de création d’une ligne de régression plus proche des données du diagramme de dispersion.