Si la théorie des probabilités a été originellement motivée par l’analyse des jeux de hasard, elle occupe aujourd’hui une place centrale dans la plupart des sciences. Tout d’abord, de par ses applications pratiques : en tant que base des statistiques, elle permet l’analyse des données recueillies lors d’une expérience, lors d’un sondage, etc.
statistique descriptive Probabilité
Introduction
La modélisation de la concentration d’ozone dans l’atmosphère évoquée au chapitre 1 est relativement simpliste. En effet, des variables météorologiques autres que la température peuvent expliquer cette concentration, comme par exemple le rayonnement, la précipitation ou encore le vent qui déplace les masses d’air. L’association Air Breizh mesure ainsi en même temps que la concentration d’ozone les variables météorologiques susceptibles d’avoir une influence sur celle-ci. Voici quelques-unes de ces données
statistique
Ce graphique permet de vérifier visuellement si une régression est correcte, c’est-à-dire de constater la qualité d’ajustement de notre modèle. Nous constatons que les observations sont globalement bien ajustées par le modèle, mais les faibles valeurs de circonférences semblent en majorité situées en dessous de la courbe. Ceci indique qu’un remplacement de cette droite par une courbe serait une amélioration possible. Peut être qu’un modèle de régression simple du type
Quelques propriétés statistiques
Le statisticien cherche à vérifier que les estimateurs des MC que nous avons construits admettent de bonnes propriétés au sens statistique. Dans notre cadre de travail, cela peut se résumer en deux parties : l’estimateur des MC est-il sans biais et est-il de variance minimale dans sa classe d’estimateurs ?
Pour cela, nous supposons une seconde hypothèse notée H2 indiquant que les erreurs sont centrées, de même variance (homoscédasticité) et non corrélées entre elles
Estimation des paramètres
Lorsque les paramètres sont estimés dans des modèles plus petits que le modèle complet (des variables explicatives sont enlevées du modèle complet), les estimateurs obtenus dans ces modèles peuvent être biaisés. En contrepartie, leur variance peut être plus faible que la variance des estimateurs obtenus dans un modèle plus « gros ». Un critère prenant en compte ces deux caractéristiques est l’erreur quadratique moyenne (EQM) que nous définirons.
La modélisation de la concentration d’ozone dans l’atmosphère évoquée au chapitre 1 est relativement simpliste. En effet, des variables météorologiques autres que la température peuvent expliquer cette concentration, comme par exemple le rayonnement, la précipitation ou encore le vent qui déplace les masses d’air. L’association Air Breizh mesure ainsi en même temps que la concentration d’ozone les variables météorologiques susceptibles d’avoir une influence sur celle-ci. Voici quelques-unes de ces données
statistique
Ce graphique permet de vérifier visuellement si une régression est correcte, c’est-à-dire de constater la qualité d’ajustement de notre modèle. Nous constatons que les observations sont globalement bien ajustées par le modèle, mais les faibles valeurs de circonférences semblent en majorité situées en dessous de la courbe. Ceci indique qu’un remplacement de cette droite par une courbe serait une amélioration possible. Peut être qu’un modèle de régression simple du type
Quelques propriétés statistiques
Le statisticien cherche à vérifier que les estimateurs des MC que nous avons construits admettent de bonnes propriétés au sens statistique. Dans notre cadre de travail, cela peut se résumer en deux parties : l’estimateur des MC est-il sans biais et est-il de variance minimale dans sa classe d’estimateurs ?
Pour cela, nous supposons une seconde hypothèse notée H2 indiquant que les erreurs sont centrées, de même variance (homoscédasticité) et non corrélées entre elles
Estimation des paramètres
Lorsque les paramètres sont estimés dans des modèles plus petits que le modèle complet (des variables explicatives sont enlevées du modèle complet), les estimateurs obtenus dans ces modèles peuvent être biaisés. En contrepartie, leur variance peut être plus faible que la variance des estimateurs obtenus dans un modèle plus « gros ». Un critère prenant en compte ces deux caractéristiques est l’erreur quadratique moyenne (EQM) que nous définirons.