Il existe deux grands types de variables aléatoires: les variables discontinues (ou discrètes) et les variables continues.
Nous envisageons des variables aléatoires discrètes (X) qui ne peuvent prendre que des valeurs entières positives ou nulles. La distribution des ces variables se représente par un diagramme en barres avec, en abscisse, les valeurs individuelles xi et, en ordonnée, la probabilité. Pour un échantillon de données, la probabilité sera estimée par la fréquence relative.
Exemple: les distributions binomiales et de Poisson.
Nous envisageons des variables aléatoires continues (X) qui peuvent prendre n'importe quelles valeurs entre deux bornes, éventuellement entre + ou - l'infini. Comme il existe une infinité de valeurs entre deux valeurs x et x+Δx (Δx tendant vers 0), la probabilité que la variable prenne la valeur exacte xi est nulle: P(X=xi)=0.
La distribution des ces variables continues se représente par une fonction continue ou densité de probabilité en fonction des valeurs de la variable. Dans le cas d'un échantillon, la distribution sera représentée par un histogramme avec, en abscisse, les classes de valeurs et, en ordonnée, la fréquence relative ou la densité de fréquences relative (féquence relative divisée par l'intervalle de classe).
Pour établir un histogramme, les valeurs xi doivent être regroupées en classes.
La variable X est représentée en abscisse. En ordonnée, on représente la densité de fréquences relatives ou, pour n tendant vers l'infini, la densité de probabilités.
Exemple: Parmi ces distributions figurent les distributions normales, normales réduites, t de Student, chi-carré et F de Fisher-Snedecor.
Les distributions des variables aléatoires discrètes binomiales et de Poisson se représentent par des diagrammes de barres et s’emploient dans les conditions particulières suivantes :
Les distributions des ces 2 variables tendent vers une distribution aléatoire normale dans certaines conditions :
X v.a. Bi (n;π) avec n supérieur à 25 et π proche de 0,5 peut être approximée par une variable aléatoire normale avec moyenne =n.π et variance=n.π(1-π)
X v.a. Po (µ) avec µ supérieur à 10 peut être approximée par une variable aléatoire normale avec moyenne et variance = µ
La loi normale caractérise les variables continues dont la fonction de densité de probabilité suit une courbe de Gauss-Laplace : elle est notée X v.a. N (µ ; σ²). La fonction de densité de probabilité dépend de 2 paramètres: la moyenne µ et la variance σ², qui sont propres à chaque variable. Calculer la probabilité que X soit inférieure à une valeur x revient à intégrer la fonction de densité de probabilité jusqu'à la valeur x. Beaucoup de variables biologiques obéissent à un tel modèle.
Toute variable aléatoire normale moyenne µ et la variance σ² peut se ramener, par simple transformation algébrique, à une variable aléatoire normale centrée sur 0 et de variance 1 : c’est la variable aléatoire réduite Z [ Z v.a. N (0 ;1)]. La conversion se fait par l’intermédiaire de la formule suivante :
TeX Embedding failed! |
L'avantage de la distribution normale réduite est qu'elle est unique et qu'il existe une seule table donnant les probabilités pour un grand nombre de valeurs de Z. Calculer la probabilité que P[X<x] revient à calculer la P[Z<z] avec TeX Embedding failed!
La variable Chi-carré est une somme de variables aléatoires normales réduites au carré (une somme de z2). Sa distribution est asymétrique et dépend d'un seul paramètre k ou nombre de degrés de liberté. Ce nombre de degrés de liberté dépend du nombre de variables aléatoires normales indépendantes intervenant dans la somme.
Exemple : dans certains contextes expérimentaux, l’expérimentateur est amené à comparer des fréquences observées (fobs) à des fréquences prédites par un modèle (fth). Pour chaque catégorie (classe), il est possible de calculer des différences observées réduites au carré (Chi-carré).
Comparons la formule de z et de chi carré: TeX Embedding failed! et TeX Embedding failed! basée sur la propriété que, pour une variable aléatoire de Poisson, la moyenne m est égale à la variance σ2 et qu'ils sont tous deux estimés par fth. La valeur chi carré observée doit donc être comparée à une distribution Chi-carré avec k degrés de liberté (= nombre de classes moins 1).
Une étude est réalisée sur une population de chauve-souris. L’envergure moyenne est, selon des publications très sérieuses, de (375 ± 15) millimètres.
La pression sanguine chez le rat suit un modèle de Gauss-Laplace. Elle est de 120 mm de Mercure pour une variance de 100 mm².
Si s vaut : … mm |
Limite inférieure |
Limite supérieure |
|
P(X≤ xi)=… |
Zi vaut … |
Lorsque la variance diminue, comme c’est le cas dans cet exercice, comment évolue la fonction f(x), notamment au niveau de la densité de probabilité lorsque X = µ ? Comparez ces valeurs pour la population totale de chauves-souris et la sous-population des mâles.