Pour une meilleure formation des élèves et des professeurs à la littératie statistique

Article mis en ligne le 13 février 2015

dernière modification le 18 mars 2015

par Jeanne Fine

Le 5 décembre 2014, le Comité Scientifique des IREM s’est penché sur l’enseignement de la Statistique.

Au cours des échanges, l’article de Michel Vigier Innumérisme et chômage sont-ils liés ? a été évoqué : un certain malaise était né à sa lecture, tant du point de vue méthodologique que de l’utilisation des statistiques. Il n’était certes pas dit que le traitement statistique des données démontrait le lien entre innumérisme et chômage, mais une petite musique subliminale, perçue par certains lecteurs semblait le suggérer.

Jeanne Fine a accepté de faire une lecture critique de l’article de Michel Vigier et d’élargir le propos dans une perspective de formation des enseignants. Voici son regard sur l’article, élogieux à propos de sa documentation, mais sévère en ce qui concerne le traitement statistique.

Le comité de rédaction de MathémaTICE assume pleinement sa responsabilité dans les lacunes de l’article publié : s’il a lui aussi, perçu un certain malaise, il n’a pas su poursuivre autant qu’il aurait fallu le dialogue confiant avec son auteur, pour rendre l’article statistiquement irréprochable.

Pour le comité de rédaction

G. Kuntz

Michel Vigier a réagi à certains aspects de l’article de Jeanne Fine. Le fichier est accessible et téléchargeable en fin d’article.

Commentaire critique, d’un point de vue statistique, de l’article de Michel Vigier, intitulé :
Innumérisme et chômage sont-ils liés ?
Entre innumérisme généralisé et redressement économique, devrons-nous choisir ? Partie 1/2.
Publié dans MathémaTICE n° 39 mars 2014

L’article de M. Vigier est publié dans MathémaTICE car le contenu qu’il présente est important à faire connaître des professeurs de mathématiques. Il est alors dommage que le traitement statistique des données présentées soit d’un niveau aussi discutable. C’est donc une critique d’un point de vue statistique que je propose ici. En revanche, je soutiens totalement l’auteur dans son combat contre l’innumérisme.

A. Une revue très intéressante de différentes enquêtes d’évaluation de compétences en numératie

M. Vigier présente des résultats de différentes enquêtes d’évaluations de compétences en numératie :

la 5ème enquête internationale PISA 2012 (élèves de 15 ans) ;
la 1ère enquête internationale PIIAC 2012 (adultes de 18 à 65 ans) ;
l’enquête nationale de la DEPP 2007 (élèves de CM2, comparaison avec l’enquête de 1987) ;
l’enquête nationale Information et Vie Quotidienne de l’INSEE 2011 (adultes de 18 à 65 ans, comparaison avec l’enquête de 2004).

Il rapproche ces résultats de ceux d’une enquête réalisée en 2010 par M. Handel sur les notions de mathématiques utilisées au travail aux États-Unis.

Les conclusions de ces évaluations convergent :

sur un niveau de compétences en numératie extrêmement inquiétant (que ce soit pour les élèves de CM2, pour ceux de 15 ans ou pour les adultes) et
sur une baisse du niveau de ces compétences par rapport aux enquêtes précédentes (lorsqu’il est possible de comparer).

PISA 2012

Dans le paragraphe PISA 2012, les tableaux 1 et 2, sensés comparer les résultats de la France et de l’Allemagne, sont tronqués. Il faut revenir à l’étude API page 7, donnée en référence, pour trouver le premier tableau complet. Entre 2000 et 2012, parmi les 34 pays de l’OCDE, la France passe du score 517 (11ème) au score 495 (18ème) alors que l’Allemagne passe du score 490 (21ème) au score 514 (10ème).

Le redressement de l’Allemagne suite à la première enquête Pisa est commenté par W. Blum, mathématicien allemand, dans la revue Commentaire [1].

« L’objectif était de modifier à la fois le mode d’enseignement (grâce à une variété de méthodes visant à activer tous les élèves sur le plan cognitif) et le contenu (avec une plus grande variété de tâches et d’activités incluant aussi la modélisation et le raisonnement)... Les six compétences obligatoires sont : raisonnement mathématique, résolution mathématique de problèmes, modélisation mathématique, représentation mathématique, travail technique -symbolique, communication mathématique. »

Pour mieux comprendre la réception des résultats de PISA en France et l’organisation de cette enquête internationale, on renvoie au compte-rendu du Café de la Statistique du 8 janvier 2013, « Comparaisons internationales des niveaux d’éducation » [2].

DEPP 2007

Les résultats de cette étude sont présentés dans la Note d’Information de l’INSEE de décembre 2008 intitulée
« Lire, écrire, compter : les performances des élèves de CM2 à vingt ans d’intervalle 1987-2007 » [3].

Le graphique 2 et le tableau 3 (Performance en calcul) de cet article méritent d’être diffusés largement : la baisse de compétences en calcul des élèves de CM2 entre 1987 et 2007 est spectaculaire.

Contrairement à ce qu’annonce M. Vigier, le graphique est tout à fait rigoureux.
Il s’agit de la représentation de la densité de fréquences du score en calcul pour l’année 1987, pour l’année 1999 et pour l’année 2007. L’aire sous chacune des trois courbes est égale à 1. Ce sont les décalages des distributions et les rapports d’aires qu’il faut lire et non les ordonnées qui n’ont aucun sens. L’échelle des ordonnées ne sert ici qu’à comparer les distributions.
Ce ne sont pas les scores bruts qui ont été utilisés. La docimologie (étude des systèmes de notation) nous apprend que les notes n’ont d’intérêt que « relativement » afin de faire des comparaisons. Ici, les scores des trois périodes ont été « normalisés » en soustrayant la moyenne et en divisant par l’écart-type du score de 1987. Pour 1987, la nouvelle variable-score est dite « centrée et réduite ».

Par rapport à 1987, les scores de 1999 et de 2007 se dégradent de plus en plus en moyenne (0 en 1987, - 0.03 en 1999 et – 0.37 en 2007) et leur variabilité (mesurée par l’écart-type) augmente (1 en 1987, 1.02 en 1999 et 1.22 en 2007). On voit aussi se former une distribution bimodale, une faible proportion des élèves maintient un niveau relativement plus élevé que l’ensemble des autres dont les évaluations en calcul se dégradent plus fortement.

Le tableau, construit à partir des quantiles, permet de commenter le graphique.
Voici un rappel des définitions des quantiles utilisés.

La médiane est la valeur de la variable qui partage la population en 2 sous-populations de même effectif : 50% prennent des valeurs inférieures à la médiane et 50% supérieures.
Les 3 quartiles sont les valeurs de la variable qui partagent la population en 4 sous-populations de même effectif : 25% prennent des valeurs inférieures au 1er quartile, 25% prennent des valeurs comprises entre le 1er et le 2ème, 25% entre le 2ème et le 3ème et 25% supérieures au 3ème. Le 2ème quartile est donc la médiane.
Les 9 déciles sont les valeurs de la variable qui partagent la population en dix sous-populations de même effectif : 10% prennent des valeurs inférieures au 1er décile, 10% entre le 1er et le 2ème, etc. jusqu’à 10% supérieures au 9ème décile. Le 5ème décile est donc la médiane.

Dans la métaphore des « poteaux et des intervalles », les quantiles jouent le rôle des poteaux.

Voici les résultats de l’évaluation en calcul des élèves de CM2 en 2007 relativement à celle de 1987 :

32% des élèves ont un score inférieur au 1er décile du score de 1987 (i.e. 10% en 1987)
57% des élèves ont un score inférieur au 1er quartile du score de 1987 (i.e. 25% en 1987)
80% des élèves ont un score inférieur à la médiane du score de 1987 (i.e. 50% en 1987).

B. « Chômage et innumérisme » … où la statistique est bien malmenée

Le dernier paragraphe de l’article s’intitule « Chômage et innumérisme ». C’est sur ce paragraphe que l’article met le projecteur puisque le titre de l’article est lui-même : Innumérisme et chômage sont-ils liés ? Entre innumérisme généralisé et redressement économique, devrons-nous choisir ?

C’est bien dommage car ce paragraphe est critiquable à plusieurs titres, la statistique y est bien malmenée !

M. Vigier propose d’étudier la corrélation entre « taux d’innumérisme » et « taux de chômage » de 22 pays de l’OCDE. Dans le tableau, la première colonne donne la liste des pays, la deuxième le « taux d’innumérisme » mesuré dans l’enquête PIAAC et la troisième le « taux de chômage » en 2013.

Le graphique et son interprétation

En fait, la deuxième colonne du tableau est un taux d’innumérisme « modifié » pour que le taux ait le même ordre de grandeur que le taux de chômage et les données sont « rangées » selon l’ordre croissant du taux d’innumérisme.
Ceci permet de proposer un graphique sous Excel qui n’a aucun sens pour l’étude de la corrélation. Sont représentées deux « courbes », une pour chaque taux avec, en abscisse, les « individus statistiques », ici les pays !

Le commentaire est le suivant : « Les deux courbes suivent des évolutions « parallèles ». La corrélation entre les deux semble forte. Effectivement, le coefficient de corrélation de Pearson calculé, r, est de 0,57. »
Ce serait donc en visualisant ce type de graphique que l’on peut se faire une idée de la corrélation entre les deux taux.

Si l’on souhaite expliquer le taux de chômage Y en fonction du taux d’innumérisme X, selon un modèle de régression linéaire Y = a X + b, le graphique est le suivant : le nuage des « individus statistiques » (ici, les pays) est représenté dans un repère orthogonal avec « taux d’innumérisme » en abscisse (sans nécessité de le modifier) et « taux de chômage » en ordonnée. Les deux variables ne jouent pas un rôle symétrique ; les coefficients de la droite de régression linéaire de Y en X, $a= \frac{cov(X,Y)}{var(X)}$ , $b=\bar{y} - a\bar{x}$, sont la solution du problème de minimisation de la somme des carrés des erreurs d’ajustement au modèle :

$f(a,b)= \sum_{i=1}^{n}(y_{i} - ax_{i} - b)^{2}$

Le nuage des 22 pays est représenté ci-après ainsi que la droite de régression linéaire de Y en X.
Le coefficient de corrélation linéaire, ici égal à 0.568, mesure la qualité de l’ajustement. [4]

Le nuage de points est bien loin de l’alignement suggéré par le graphique de M. Vigier. De plus, il semble bien que c’est l’Espagne qui fait « bras de levier » pour la droite de régression linéaire de Y en X.

Si l’on supprime l’Espagne, le nuage s’arrondit et le coefficient de corrélation linéaire « chute » à 0.425 ; qui plus est, cette valeur n’est pas significativement différente de 0 au seuil de 5% (test bilatéral) : on ne peut pas conclure à une corrélation linéaire entre taux de chômage et taux d’innumérisme !

La déontologie statistique

Ceci est une preuve supplémentaire que l’on peut faire dire n’importe quoi aux statistiques… lorsque l’on ne respecte pas une certaine déontologie. La déontologie statistique impose de décrire les procédures statistiques qui vont être utilisées avant de travailler sur les données. Il est donc incorrect de supprimer de l’étude l’Espagne, la Corée ou la Slovaquie.

Au lieu de supprimer les « points aberrants » (car tel est le nom des individus statistiques qui sortent du rang !), il faut s’appuyer sur eux pour avoir éventuellement une autre explication.
On observe en Espagne un taux de chômage de 8.3% en 2007 et de 26.2% en 2012, soit un triplement en 5 ans [5].
La brusque augmentation de ce taux de chômage doit avoir une autre explication qu’une brusque augmentation du taux d’innumérisme !

Corrélation et causalité

Le grand problème avec la mise en évidence d’une « corrélation » entre deux variables, c’est qu’elle sous-entend une notion de « causalité ». Pour M. Vigier, l’innumérisme des français explique le piètre niveau économique de la France, mesuré par son taux de chômage.
On sait pourtant que la réussite scolaire est liée à un environnement familial favorable et que le chômage entraîne la pauvreté, le décrochage scolaire et la montée de l’innumérisme. Pourquoi est-ce que c’est le taux d’innumérisme qui « influerait » sur le taux de chômage ?

La notion d’indicateur

Pour répondre à la critique d’une causalité implicite, M. Vigier fait appel à la « notion d’indicateur » : S’il y avait une corrélation forte, dans le temps, entre le nombre de cigognes en Alsace et le taux de natalité, ce serait donc un indicateur.
Les « séries chronologiques » (variables dépendant du temps) fournissent justement de bons exemples pour mettre en évidence la difficulté d’interprétation de la notion de corrélation linéaire.
Notons que si deux variables $X$ et $Y$ sont liées linéairement à une troisième T alors elles sont liées linéairement entre elles. En effet, si $X = a T + b$ et $Y = c T + d, a$ et $c$ supposés non nuls, alors $Y = e T + f$ avec $e=\frac{c}{a}$ et $f = d - \frac{cb}{a}$.
Il suffit de choisir deux séries chronologiques X et Y évoluant linéairement avec le temps T pour trouver une liaison linéaire entre elles.

En aparté, je réponds à la question des professeurs de mathématiques se demandant pourquoi on parle de liaison linéaire et non affine : les variables observées sur un échantillon de taille n peuvent être considérées comme des vecteurs de l’espace vectoriel $\mathbb{R}^{n}$. En notant $1$ le vecteur dont tous les éléments sont égaux à 1, $aT + b1$ est une combinaison linéaire des variables $T$ et $1$ ; le modèle $X = a T^{2} + b1$est donc aussi un modèle linéaire.

La critique essentielle faite à l’utilisation de plus en plus massive des indicateurs est de vouloir « expliquer » un phénomène complexe avec une seule variable. Dès que l’on travaille en multidimensionnel apparaissent des paradoxes : deux variables corrélées positivement entre elles peuvent être de corrélation nulle ou même négative conditionnellement à une troisième variable. La gouvernance par les indicateurs montre des effets pervers qui sont de plus en plus souvent dénoncés : cf. en particulier l’ouvrage de Maya Beauvallet [6].

Donner à voir une corrélation détourne l’attention

Pour revenir sur « chômage » et « innumérisme », il y aurait beaucoup à dire sur la convention internationale de définition du chômage permettant de le mesurer et de comparer les taux d’un pays à l’autre. De plus, sa variabilité dans le temps s’explique par bien d’autres « causes » que l’innumérisme qui est un taux relativement plus stable.

En fait, donner à voir une corrélation entre « taux de chômage » et « taux d’innumérisme » des pays de l’OCDE est une façon de détourner l’attention du lecteur et de mettre un voile sur d’autres facteurs possibles de hausse du chômage autrement plus pertinents. On cherche la clé sous le réverbère !

C. A quoi sert donc la corrélation en statistique ?

La corrélation linéaire intervient lorsqu’on cherche à expliquer une variable en fonction d’une autre ou de plusieurs autres dans le cadre d’un modèle de régression linéaire. On choisira les variables explicatives les plus corrélées à la variable à expliquer, en les introduisant dans le modèle de façon à contrôler le problème des corrélations conditionnelles déjà évoquées précédemment. Les champs d’application sont immenses ; le problème en statistique ne vient pas des méthodes d’analyse et de la modélisation mais de leur utilisation.

La corrélation linéaire joue également un rôle important dans le cadre de la statistique factorielle multidimensionnelle qui repose sur l’algèbre linéaire et la géométrie euclidienne, dont la méthode de base est l’ACP (analyse en composantes principales). Comme on l’a déjà évoqué ci-dessus, les variables quantitatives sont représentées par des vecteurs, les variables centrées sur leur moyenne sont représentées par la projection de ces vecteurs sur un hyperplan orthogonal à la variable-constante 1, l’écart-type est la norme du vecteur projeté et la corrélation linéaire de deux variables est le cosinus de l’angle formé par les deux vecteurs projetés. Ces méthodes descriptives sont très utilisées pour réduire la dimension des grands tableaux de données.

Repérer des corrélations insoupçonnées entre variables dans des grandes bases de données est un objectif important du « data mining ».

Dans le cadre gaussien, la non-corrélation des variables aléatoires équivaut à leur indépendance.

En résumé, dès que l’on a deux variables se pose la question d’un lien éventuel entre ces variables ; lorsque l’on a davantage de variables l’étude des liens entre variables pose des problèmes méthodologiques difficiles.

D. A propos de « pourcentages » et de « proportionnalité »

La dernière étude présentée par M. Vigier concerne les notions mathématiques utilisées au travail aux U.S. en 2010 de Handel [7]. Le tableau 5 est le suivant :

Taux d’utilisation des notions mathématiques requises au travail

Notions mathématiques	Taux requis au travail (%)
Numération, ordre	94
Addition - Soustraction	86
Multiplication - Division	78
Proportionnalité (%, fractions, ...)	68
Autres notions plus complexes	< 22

J’ai été étonnée par le libellé de la quatrième notion mathématique : « Proportionnalité (%, fractions, ...) ». Après vérification, Handel a seulement écrit « Fractions » dans son article, tableau page 43.
Il est bien possible que, aux U.S., la notion « Fractions » recouvre l’écriture fractionnaire et l’écriture en pourcentage (éventuellement approchée) des nombres rationnels. Mais la notion de proportionnalité fait probablement partie des notions plus complexes.

En revanche, en France, les « pourcentages » sont indissociablement liés à la « proportionnalité », recherche de la quatrième proportionnelle dont le terme correspondant est 100. Si la proportionnalité fait l’objet de nombreuses recherches par les didacticiens, il y a en revanche un véritable aveuglement sur l’incohérence de la présentation des pourcentages dès la sixième (du style 100 x 25/125 = 20 %). Sur cette question, je renvoie à mon libre-propos publié en 2012 dans la revue Statistique et Enseignement [8].

E. Pour une meilleure formation des élèves et des professeurs à la littératie statistique

L’innumérisme en France est un problème qui n’est pas encore suffisamment pris en compte par les acteurs de l’éducation nationale, en particulier par les professeurs de mathématiques. Une meilleure formation des professeurs à la littératie statistique pourrait améliorer l’enseignement des mathématiques. Par littératie statistique, il faut comprendre la « pratique » de la statistique, la lecture de tableaux et graphiques publiés dans les médias, l’utilisation et l’interprétation des notions essentielles, la démarche statistique (formuler une question, collecter les données, analyser les données, interpréter les résultats). On pourra consulter à ce sujet la présentation du rapport GAISE (curriculum statistique proposé par l’Association Américaine de Statistique) [9].

Notes

[1] Kantor, J.M. dir. (2012). Débat sur « Réparer l’enseignement des mathématiques. Le faut-il et comment ? », Revue Commentaire, 35(138), 481-526.

[2] Café de la Statistique (2013) Comparaisons internationales des niveaux d’éducation
Jean-Claude Emin, ancien secrétaire général du Haut conseil de l’évaluation de l’école, et Thierry Rocher, statisticien à la Direction de l’évaluation, de la prospective et de la performance [DEPP] du ministère de l’éducation nationale.

[3] Rocher, T. (2008). Lire, écrire, compter : les performances des élèves de CM2 à vingt ans d’intervalle 1987-2007. Note d’Information de l’INSEE, 08-38.

[4] Hubert Raymondaud propose ce type de graphique en annexe de l’article de Michel Vigier ; nous avons ici interverti le rôle des taux, « Taux d’innumérisme » en abscisse, « Taux de chômage » en ordonnée.

[5] Taux de chômage dans l’Union Européenne (Statistiques mondiales)

[6] Beauvallet, M. (2009). Les stratégies absurdes, comment faire pire en croyant faire mieux, Seuil.

[7] Handel, M. (2010).
What Do People Do at Work ? A Profile of U.S. Jobs from the Survey of Workplace Skills, Technology, and Management Practices (STAMP)

[8] Fine, J. (2013). Quelle est votre définition de « pourcentage » ? Proposition pour l’enseignement. Statistique et Enseignement, 3(2), 87-97] .

[9] Fine, J. (2013). Le rapport GAISE (U.S.). Cadre d’un curriculum statistique de la maternelle à la Terminale. Statistique et Enseignement, 4(1), 25-54