cours statistique

Statistique descriptive à une dimension

Vocabulaire statistique
Organisation des données
Réduction des données - Paramètres statistiques

Statistique descriptive à deux dimensions

Définitions et notations
Tableau de contingence
Paramètres d’une distribution double
Ajustement linéaire

Cours statistique descriptive

Cours N°1

Cours N°2

Cours N°3

Cours N°4

Cours N°5

résuméN°1

L’objectif de cet cours est de rendre accessible au plus grand nombre une des méthodes les plus utilisées de la statistique : la régression. Nous souhaitons aborder de manière simultanée les fondements théoriques et les questions inévitables que l’on se pose lorsque l’on modélise des phénomènes réels. En effet, comme pour toute méthode statistique, il est nécessaire de comprendre précisément la méthode et de savoir la mettre en œuvre

La concentration en ozone

Nous allons traiter les 50 données journalières de concentration en ozone. La variable à expliquer est la concentration en ozone notée O3 et la variable explicative est la température notée T12. Les données sont traitées avec le logiciel GNU-R.

Théorie et applications

Ce graphique permet de vérifier visuellement si une régression est correcte, c’est-à-dire de constater la qualité d’ajustement de notre modèle. Nous constatons que les observations qui possèdent de faibles valeurs ou de fortes valeurs de température sont au-dessus de la droite ajustée (fig. 1.14) alors que les observations qui possèdent des valeurs moyennes sont en dessous.

Les erreurs ne semblent donc pas identiquement distribuées. Pour s’en assurer il est aussi possible de tracer les résidus. Pour une régression simple, les deux choix sont possibles, mais pour une régression multiple, seul le tracé des résidus sera réalisable. Enfin l’intervalle de confiance à 95 % est éloigné de la droite. Cet intervalle peut être vu comme « le modèle peut être n’importe quelle droite dans cette bande ». Il en découle que la qualité de l’estimation ne semble pas être très bonne.

La régression linéaire simple

Si nous nous intéressons au rôle des variables, nous pouvons calculer les intervalles de confiance des paramètres. Ce calcul n’est pas automatique mais il est relativement simple (voir équation 1.5 p. 19). Il nécessite d’utiliser les informations sur les coefficients contenues dans l’objet resume et plus particulièrement les estimations des coefficients et les estimations de leur écart-type. Cette extraction est faite à l’aide de la fonction coef() et permet d’obtenir la matrice 2 lignes × 4 colonnes contenant toutes ces informations.

Régression - Théorie et applications

Ce graphique permet de vérifier visuellement si une régression est correcte, c’est-à-dire de constater la qualité d’ajustement de notre modèle. Nous constatons que les observations sont globalement bien ajustées par le modèle, mais les faibles valeurs de circonférences semblent en majorité situées en dessous de la courbe. Ceci indique qu’un remplacement de cette droite par une courbe serait une amélioration possible. Peut être qu’un modèle de régression simple du type

أقسام الوصول السريع (مربع البحث)

cours statistique