Voici comment utiliser les outils intégrés d'Excel pour faciliter l'analyse statistique.

Les parcelles résiduelles jouent un rôle essentiel dans l'analyse de régression. Ils vous indiquent avec quelle précision votre ligne de régression représente la relation entre deux variables. Le guide suivant explique comment calculer et tracer les résidus Excel à l'aide de deux méthodes.

Mais avant d'en venir aux bonnes choses, comprenons brièvement les résidus et leur importance dans une analyse de régression.

Que sont les résidus et pourquoi sont-ils importants?

Un résidu est une différence entre la valeur observée (réelle) et la valeur prédite. En termes plus simples, un résidu est une erreur. Par exemple, si la valeur observée est de 10 et que votre modèle a donné une valeur de 8, la valeur résiduelle serait de 2.

D'autre part, un diagramme de résidus est un nuage de points dans lequel la variable indépendante (âge) est tracée sur l'axe horizontal et les résidus (erreurs) sont tracés sur l'axe vertical.

instagram viewer

Ok, vous savez ce que sont les résidus, mais pourquoi sont-ils importants? Pour comprendre cela, considérons le cas suivant :

Nous voulons comprendre la relation entre l'âge et les taux d'épargne. Pour cela, nous tracerons une droite de régression. Cependant, nous ne savons pas si la ligne de régression représente avec précision la relation entre les deux variables. C'est là que les résidus entrent en jeu. Nous utilisons un graphique résiduel pour vérifier l'exactitude de la droite de régression.

Maintenant que vous savez ce que sont les résidus, apprenons à créer un graphique résiduel dans Excel :

Comment créer un tracé résiduel à l'aide de l'équation de la ligne de tendance

La première méthode de tracé des résidus dans Excel utilise une équation de courbe de tendance pour calculer les valeurs prédites pour nos données. Une fois que nous avons cela, nous pouvons calculer les résidus en soustrayant les valeurs prédites des valeurs observées. Enfin, nous créons un nuage de points avec les prédicteurs sur l'axe horizontal et les résidus sur l'axe vertical.

Bien que cette méthode nécessite plus d'étapes que la seconde méthode, c'est un excellent moyen de comprendre le concept. Une fois que vous avez une bonne compréhension, vous pouvez utiliser la deuxième méthode, qui nécessite moins de temps et d'efforts.

Laissez-nous vous guider à travers le processus, une étape à la fois :

Étape 1: Saisir les données

Nous commençons par entrer les valeurs du prédicteur (sous le X colonne) et les valeurs observées (sous la Oui colonne):

Étape 2: créer un nuage de points des données

Nous créons maintenant un nuage de points des données en suivant les étapes ci-dessous :

Si vous n'êtes pas familier avec les nuages ​​de points, voici un article complet sur créer un nuage de points dans Excel et présenter vos données. Vous pouvez également apprendre à utiliser un nuage de points dans Excel pour prédire le comportement des données.

  1. Sélectionnez les données (sous X et Oui Colonnes).
  2. Allez à la Ruban Excel et cliquez Insérer.
  3. Dans le Graphiques section, cliquez sur la flèche sous la Nuage de points option.
  4. Sélectionnez le premier nuage de points (Scatter avec uniquement des marqueurs).
  5. Vous obtiendrez un nuage de points similaire au graphique suivant :

Étape 3: Ajouter une courbe de tendance et afficher l'équation de la courbe de tendance sur le nuage de points

Suivez les étapes ci-dessous pour ajouter une courbe de tendance au nuage de points :

  1. Cliquez sur le nuage de points.
  2. Allez à la Ruban Excel et cliquez Mise en page.
  3. Dans le Arrière-plan section, cliquez sur la flèche sous la Ligne de tendance icône.
  4. Sélectionnez le Ligne de tendance linéaire option.

Vous verrez maintenant une ligne (ligne de tendance) coupant les points sur votre nuage de points. Pour afficher l'équation de la courbe de tendance sur le nuage de points, suivez les étapes ci-dessous :

  1. Allez encore au Ligne de tendance icône et cliquez sur la flèche en dessous.
  2. Cliquez sur Plus d'options de ligne de tendance.
  3. UN Formater la courbe de tendance boîte de dialogue apparaîtra.
  4. Vérifier la Afficher l'équation sur le graphique option au bas de la Formater la courbe de tendance boite de dialogue. L'équation de la ligne de tendance s'affichera sur le graphique.

Étape 4: Calculer les valeurs prédites

Pour calculer les valeurs prédites, créez une autre colonne (Z) à côté de vos données et suivez les étapes ci-dessous :

  1. Entrez la formule de la courbe de tendance affichée sur le graphique et collez-la sous la colonne Z (cellule C2). Changer la X dans la formule avec des valeurs sous la colonne X.
  2. Ainsi, pour la première valeur prédite, la formule serait donnée comme suit:
    =1.5115*A2+23.133
  3. Remplacer A2 avec A3 dans la formule de la courbe de tendance pour la deuxième valeur prédite.
  4. Pour la troisième valeur prédite, remplacez A3 avec A4, et ainsi de suite, jusqu'à ce que vous obteniez toutes les valeurs prédites pour leurs prédicteurs correspondants.

Étape 5: Trouver les valeurs résiduelles

Maintenant que nous avons les valeurs prédites, nous pouvons trouver les valeurs résiduelles en soustrayant les valeurs prédites des valeurs observées (réelles) sous la colonne Y. La formule de la première valeur résiduelle serait =B2-C2. Pour le second, la formule serait =B3-C3, et ainsi de suite.

Étape 6: créer le tracé résiduel

Pour créer un tracé résiduel, nous avons besoin du prédicteur et des valeurs résiduelles. Maintenant que nous avons les deux, suivez les étapes ci-dessous :

  1. Sélectionner les colonnes Oui et Z.
  2. Faites un clic droit et sélectionnez Cacher.
  3. Sélectionnez maintenant le X et Résidus Colonnes.
  4. Allez à la Insérer onglet dans le ruban Excel.
  5. Cliquez sur la flèche sous le Dispersion icône.
  6. Sélectionnez le Scatter avec uniquement des marqueurs option.
  7. Vous obtiendrez votre tracé résiduel, comme indiqué ci-dessous.

Pour la deuxième méthode, tout ce que vous avez à faire est de fournir les données à Excel, et il fait tout le travail. Vous pouvez créer un tracé résiduel en quelques clics seulement. Mais pour cela, vous devrez charger le Toolpak d'analyse d'Excel. Commençons:

  1. Allez à la Déposer onglet et cliquez Options.
  2. Le Options Excel boîte de dialogue apparaîtra.
  3. Allez à la Gérer case (en bas), sélectionnez Compléments Excel, et cliquez Aller.
  4. Un Compléments boîte de dialogue apparaîtra.
  5. Vérifier la Boîte à outils d'analyse case et cliquez d'accord.
  6. Allez maintenant au Ruban Excel et cliquez Données.
  7. Vous trouverez le L'analyse des données icône dans le Analyse section.

Étape 2: Saisir les données

  1. Sélectionner les colonnes UN et D, et cliquez avec le bouton droit de la souris. Cliquez sur Afficher.
  2. Copiez maintenant le X et Oui Colonnes.

    Vous remarquerez que le graphique a changé après avoir affiché les colonnes. Pour revenir au tracé résiduel d'origine, nous devrons masquer le Oui et Z colonnes (en sélectionnant le Oui et Z colonnes, en cliquant avec le bouton droit de la souris et en sélectionnant Cacher).

  3. Ouvrez une nouvelle feuille Excel et collez le X et Oui Colonnes.
  4. Cliquez sur le nouveau L'analyse des données possibilité dans le Analyse partie de la Données languette.
  5. UN L'analyse des données boîte de dialogue apparaîtra.
  6. Rechercher et sélectionner Régression sous Outils d'analyse.
  7. Cliquez sur D'ACCORD. Le Régression boîte de dialogue apparaîtra.
  8. Entrez les valeurs dans le Oui colonne (les prédicteurs, B2:B11) dans le Plage d'entrée Y champ.
  9. Entrez la plage de cellules dans le X colonne (les variables indépendantes, A2:A11) dans le Plage d'entrée X champ.

Étape 3: créer le tracé résiduel

Dans le Régression boîte de dialogue, sous la Options de sortie, vérifier Nouvelle feuille de travail, et cliquez D'ACCORD.

Excel créera automatiquement le tracé résiduel avec les sorties suivantes que vous pouvez utiliser pour vérifier la fiabilité de votre modèle de régression :

  • Statistiques de régression
  • Tableau ANOVA
  • Tableau des coefficients
  • Sortie résiduelle

Le ToolPak d'analyse d'Excel offre une gamme de fonctionnalités statistiques utiles que vous pouvez utiliser pour analyser vos ensembles de données. Après avoir créé le tracé résiduel via le ToolPak d'analyse d'Excel, vous pourriez commencer à vous gratter la tête en regardant tous les tableaux compliqués. Mais une fois que vous avez appris à effectuer une analyse fondamentale des données dans Excel, les chiffres ne sont plus si effrayants.