par Jean-Philippe Vanroyen
Le tableur et le langage Visual Basic permettent l’etude empirique de la loi binomiale au programme des différentes séries de BTS. Les quelques feuilles proposées constituent en effet des outils qui peuvent accompagner utilement le cours sur la loi binomiale et sur son approximation par une loi normale.
Découvrir la loi binomiale avec le tableur
Vidéo-projeté en classe, ce classeur peut accompagner utilement les points de cours portant sur la loi binomiale et sur son approximation par une loi normale. Ces lois sont en effet au programme de la plupart des BTS.
Ce classeur utilise le langage VBA (Visual Basic for Applications). Il est sans doute possible de construire un classeur équivalent avec Open Office mais le langage Basic est différent et je ne le maîtrise pas.
Rappelons en quoi consiste la loi binomiale.
Si on répète de manière indépendante n expériences de même probabilité de réussite p alors la variable aléatoire X égale au nombre de réussites de cette expérience suit la loi binomiale de paramètres n et p.
Les valeurs possibles de cette variables aléatoires sont donc les entiers compris entre 0 et n et on démontre en cours que l’on a : (1)
Les feuilles de ce classeur (sauf la dernière) proposent quelques outils permettant une étude empirique de cette loi. Le cours et les activités qui l’accompagnent restent indispensables mais gagneront à être accompagnés par ces feuilles. C’est le cours (ou les activités) qui peut proposer une démontration de la formule (1). La feuille, elle, permet au moins deux choses : elle facilite la compréhension concrète de cette loi binomiale et d’autre part les estimations obtenues peuvent constituer un outil de vérification des formules proposées par les étudiants, à la recherche de la loi.
Une fois la définition de la loi binomiale posée, il s’agit de découvrir sa loi de probabilité.
Mais avant cette recherche, il est important que la variable aléatoire X soit parfaitement comprise
Il est important de faire quelques expériences pour avoir ne serait-ce qu’une vague idée de la loi recherchée. Il faut faire en sorte de la « rendre la plus concrète possible ».
C’est l’objet des deux premières feuilles.
La première feuille « simulation » propose donc une modélisation de la répétition de ces n expériences, ce que nous appelerons une simulation.
On entre les paramètres n et p puis on clique sur le bouton « Faire une simulation ». Pour chacune des expériences une petite boîte de dialogue apparaît et annonce clairement le résultat de l’expérience ; parallèlement la feuille se remplit. Volontairement, il faut, pour valider le résultat de chaque expérience et passer à la suivante, appuyer sur le bouton « OK ». Il s’agit ici de bien faire saisir le côté répétitif de la loi binomiale, qui est en effet égale à la somme de n variables de Bernoulli indépendantes. Une fois toutes les expériences réalisées, on récapitule alors les résultats :
On découvre également les valeurs fréquentes de X et on peut déjà parler de l’espérance de X.
Par exemple, on peut faire remarquer que quand p = 0,5 et n = 20 alors X vaut souvent à peu près 10 mais que par contre que la distribution des « reussie » dans les 20 expériences est la plupart du temps très irrégulière ! Ce constat n’est pas intuitif. Mais de toute façon on s’intéresse ici à la valeur de X et non à la distribution des « reussie » dans les n expériences. Mais si c’est hors-sujet, cette remarque est importante, ne serait-ce que pour la culture !
A ce stade, quand la variable aléatoire X est bien « comprise », les étudiants recherchent la loi de probabilité c’est à dire la formule (1). Les activités possibles accompagnant cette recherche sont nombreuses mais il est hors sujet de les présenter ici.
Mais, sans professeur, comment un étudiant peut-il « vérifier » sa formule ?
Ici le tableur trouve encore toute sa place. La feuille « loi_binomiale » propose donc de rechercher l’allure de la distribution de probabilité de X en procédant à de nombreuses simulations. Les résultats de la feuille peuvent être comparées aux résultats des étudiants qui recherchent par exemple la loi de probabilité de B(3 ;1/3).
Cette feuille accompagne donc la phase de recherche de la loi.
Deux boutons sont disponibles. Le mode 2 est plus rigoureux mais la construction du graphique prend davantage de temps.
Chaque bouton déclenche une animation : le graphique est en effet construit progressivement, au fur et à mesure que les simulations sont effectuées. Ce qui illustre bien le fait qu’il s’agit de répéter de nombreuses simulations. Et à chaque simulation, le graphique se met à jour.
Voilà par exemple ce que donne 2000 simulations ( n=3 et p=1/3 ) :
soit les fréquences empiriques 29,9% , 44,5% , 22,4% et 3,2 %
au lieu des probabilités théoriques 29,6% , 44,4%, 22,2% et 3,7%
Dès qu’un étudiant a une proposition de formule, il peut éventuellement la tester en utilisant cette feuille, pour différentes valeurs de n et de p.
A ce stade la formule (1) est découverte et démontrée.
En utilisant la feuille 2, on remarque aussi qu’il faut augmenter sérieusement le nombre de simulation, dans le cas où n est grand, pour avoir une distribution de probabilité fiable.
Cet aspect du problème ne concerne pas strictement la loi binomiale mais il est intéressant de profiter du contexte pour l’étudier de plus près. C’est l’objet de la feuille « comparaison ».
Cette feuille permet de construire la représentation graphique de la loi binomiale (c’est la courbe violette) et de la comparer avec les diagrammes à barre précédents.
Voilà ce que donne par exemple n=100 , p=1/3 et 500 simulations.
Pour avoir peu d’écart entre la distribution théorique et la distribution expérimentale, il faut augmenter très sensiblement le nombre de simulations (plusieurs milliers). C’est une constation empirique.
Dans le cas ci-dessus, quand n=5000, on obtient une très bonne approximation de la loi théorique par les fréquences empiriques.
Ce thème d’étude rejoint plutôt la théorie de l’estimation et des tests d’hypothèses. Mais nous avons l’occasion , sans la nommer, de l’illustrer ici , donc autant en profiter !
Il faut maintenant bien faire appréhender les différentes allures des lois binomiales et en particulier leur forme quasi-sytématique de courbe en cloche (feuille « B_n_p »)
Dans cette feuille, on ne travaille que sur les valeurs de p. Il n’y a pas de VBA ici. Il s’agit d’étudier les différentes allures de la loi binomiale en fonction de p pour trois types de valeurs de n : une petite, une moyenne et une grande.
On découvre immédiatement la célèbre courbe en cloche sauf pour des petites (ou grandes) valeurs de p. Les étudiants apprendront dans la suite de ce cours que l’on approxime dans ce cas la loi binomiale par une loi de Poisson de paramètre np.
Par exemple, n=50 et p=0,04 donnent
Plus tard dans le cours, on montre que la loi normale est une bonne approximation de la loi binomiale dans de nombreux cas. La feuille « Bin_Norm » propose d’étudier cette approximation.
Voilà ce que donne l’approximation de B(50 ; 0,4) par N(20 ; 3,464) :
Remarquons ici qu’il est très important que les rectangles représentant la loi binomiale soient contigus puisque l’approximation s’interprète graphiquement à l’aide des aires.
On peut également faire remarquer aux étudiants que le graphique n’est pas très fiable car quand on prend par exemple n=15 et p=0,4 alors le graphique obtenu montre une approximation qui semble acceptable bien que ce ne soit pas le cas. Le graphique ne suffit donc pas.
C’est pour cela que la colonne D propose le calcul de l’écart entre les 2 lois. Ce calcul, couplé à une mise en forme conditionnelle, montre immédiatement si l’approximation est valable ou non. Dans la feuille c’est la tolérance qui permet de régler ce dernier point. Par défaut on tolère un écart de 0,2 % ; au-delà on met en rouge l’écart.
Conclusion
Ces quelques feuilles peuvent accompagner de manière utile le cours sur la loi binomiale. Ce n’est pas obligatoirement le professeur qui les manipulera. Il pourra en effet être très bénéfique de demander aux étudiants de le faire à sa place.
Certes, on peut traiter tout le cours sur la loi binomiale sans tableur. Pourtant il n’en est pas moins vrai qu’ici, le tableur apporte des « plus » indéniables.
Il permet de vérifier des conjectures (recherche d’une loi de probabilité ici).
Les animations (la construction progressive des graphiques) illustrent bien cette notion délicate qu’est la convergence d’une loi vers une autre.
Le calcul de probabilité reste toujours théorique en classe. Il est en effet rare de procéder manuellement aux expériences décrite (à moins de demander aux étudiants de lancer 100 fois un dé). Le tableur pallie à ce manque car il permet une simulation de ces expériences : comme si on les faisait....
Les aller-retours entre ces feuilles, le cours et les activités sont riches car ils relèvent d’approches différentes mais complémentaires. Le dialogue avec les étudiants et la compréhension de la notion, s’en trouvent grandement favorisés.