par Alain Busser, Guillaume Connan, Hubert Raymondaud, Pierre-Marc Mazat, Stéphan Manganelli
Cet article peut être librement diffusé et son contenu réutilisé pour une utilisation non commerciale (contacter l’auteur pour une utilisation commerciale) suivant la licence CC-by-nc-sa (http://creativecommons.org/licenses/by-nc-sa/3.0/fr/legalcode)
Cette cinquième édition de la rubrique Regards croisés sur l’algorithmique et la programmation est consacrée aux statistiques.
Contribution d’Alain Busser
Pour saisir des données et faire de la statistique dessus, voir le travail de l’IREM de Lyon autour de Christian Mercat (le spécialiste des entrelacs et graphes ;-))
Et, si JSXGraph n’est pas du CoffeeScript mais du JavaScript, l’un de ses exemples montre comment saisir des données en JavaScript : en utilisant AJAX
- Statistiques et arithmétiques avec MathsOntologie
Le logiciel MathsOntologie peut être téléchargé en suivant ce lien ; sa documentation en pdf est ici
l’article au format pdf | son source en odt |
- CoffeeScript
L’outil de programmation alcoffeethmique a été utilisé ici :
l’article en pdf | son source en odt | le génome étudié dans le document |
- La calculatrice Ti-82Stats-fr
Quelques exemples
Dans les onglets suivants, on montre
- comment les outils statistiques de la Ti82stats-fr permettent de calculer l’équation réduite de la droite par deux points
- comment on peut utiliser le mode histogramme pour conjecturer l’allure d’une loi de probabilité
- comment on peut tester la normalité d’une variable aléatoire
La statistique inférentielle a été traitée dans le dernier onglet de cet article.
Droite par deux points
L’exercice, classique en Seconde, intervient deux fois dans le programme :
- en parlant des fonctions affines
- en parlant des équations de droites
Voici l’énoncé de l’exemple traité ci-dessous :
Déterminer l’équation réduite de la droite passant par A(2 ;1) et B(4,2). |
Mais on ignore souvent que c’est en fait un exercice de statistiques ! En effet, la droite (AB) n’est autre que la droite de régression linéaire obtenue avec le nuage de points A et B.
Alors on entre les coordonnées de A et B dans l’éditeur statistique :
Puis on choisit, parmi les calculs, la régression linéaire :
On applique la régression aux deux listes L1 (liste des abscisses) et L2 (liste des ordonnées) :
On obtient alors l’équation réduite cherchée :
Recherche de loi
La somme de 12 variables aléatoires uniformes suit approximativement une loi normale de paramètres 6 et 1. La visualisation se fait aisément avec un histogramme. On commence donc par créer une liste L1 de 100 sommes de 12 nombres aléatoires, par un programme :
Puis on positionne un affichage statistique en mode « histogramme » :
Le fenêtrage est important ici, parce que les largeurs des rectangles sont conditionnés par le paramètre Xgrad :
L’histogramme a bien une forme de cloche :
Cette partie de l’activité est si rapide que l’on a le temps de chercher pour quelles valeurs des paramètres, la loi gaussienne approche bien l’histogramme ; expérimentalement, on trouve 6, 1 et 400 :
La coïncidence est plutôt bonne :
Pour tester un peu plus sérieusement la normalité de cette variable aléatoire, voir l’onglet suivant.
Test de normalité
Pour savoir si une variable aléatoire est vraiment normale, la Ti effectue un test visuel basé sur la droite de Henry : On trace un nuage de points et on regarde s’ils ont l’air alignés.
On commence donc par créer, comme dans l’onglet précédent, une liste L1 de 100 sommes de 12 nombres aléatoires, par un programme :
Puis on configure un affichage statistiques en mode « droite de Henry » :
(et les points gagnent à être dessinés petits parce qu’ils sont nombreux).
Ensuite, puisque c’est un test graphique, il convient de paramétrer le graphique :
En appuyant sur « Graph », on constate que les problèmes arrivent surtout aux valeurs extrêmes :
Mais ceci n’est pas très étonnant, puisque l’approximation est bornée (entre 0 et 12), contrairement à la loi normale de paramètres 6 et 1.
Contribution de Guillaume Connan
Stéphan Manganelli fait une infidélité à LARP
En effet, cette fois-ci, il a choisi GeoPlan pour parler des couples moyenne-écart type et médiane-écart absolu moyen :
Contribution de Pierre-Marc Mazat
Comme les lycanthropes se transforment une fois par mois, Pierre-Marc se lance tous les 4 ans (à l’occasion des coupes du monde) dans des études théoriques sur le ballon de foot. Ainsi, il y a 4 ans, il avait créé un CaRSCript de construction de patron de l’icosaèdre tronqué. Aujourd’hui, il joue les prolongations avec une étude statistique sur les arêtes choisies au cours de la construction du patron. Un programme en Java (langage) se charge de produire les numéros d’arêtes choisies, et d’enregistrer les entiers en question dans des fichiers « texte » qu’il est ensuite aisé d’analyser avec des outils adéquats (tableur par exemple).
Généralités | stats sur 10 000 patrons | stats sur 50 000 patrons |
Contribution d’Hubert Raymondaud : Le jeu des trois distributions
(avec Brigitte Chaput)
Dans la brochure APMEP n°167 (septembre 2007), j’avais proposé cette activité avec comme outil un tableur bien connu.
Les versions actuelles des tableurs ne permettant plus de réaliser cette activité, Brigitte Chaput a eu l’idée de réaliser l’outil avec Geogebra.
Trois séries statistiques sont présentées avec leur représentation graphique sous formes de points sur une droite et de boites à pattes.
Moyenne et écart type sont visualisés.
L’activité consiste à modifier les valeurs des séries (en modifiant la position des points sur les droites avec la souris) afin d’obtenir, par exemple, la même moyenne et le même écart type (au centième près) mais trois séries différentes.
Trois fichiers Geogebra sont proposés pour travailler sur différents indicateurs de dispersion, écart type, étendue, écart inter-quartile.
La construction de l’outil Geogebra est expliquée dans le document « ConstructionDuJeuDesTroisDistributions.doc » ci-dessous.
À vous de jouer ... Bonne chance ...
construction de l’outil ggt | l’article |
Les trois versions du jeu, au format ggb :
écart-type | interquartile | étendue |