Pourquoi et comment évaluer par compétences ? - [Les nouvelles technologies pour l'enseignement des mathématiques]

Pourquoi et comment évaluer par compétences ?

Article mis en ligne le 15 octobre 2014

dernière modification le 8 septembre 2016

par Stéphane Guyon

Cet article est le deuxième que Stéphane Guyon consacre à l’évaluation par compétences dans MathémaTICE. Voici le premier.

Le logiciel SACoche est un outil central de l’article.

Cet article est particulièrement important à un moment où le Ministère de l’Education Nationale amorce un changement d’attitude au sujet de l’évaluation. (Le changement d’attitude a fait long feu ! NDLR)

Une autre version de cet article a été repris dans le n° 98 de la revue Repères-IREM

On lira aussi avec intérêt les articles de Laurent Fillion sur le même sujet, parus dans Mathématice et sur son site personnel

L’article de Rémi Angot sur l’évaluation à la carte automatisée mérite une attention particulière.

Une vidéo de Stéphane Guyon reprend les thèmes de l’article qui suit.

Voyez aussi.

Enfin, d’autres thèmes sont abordés par Stéphane Guyon dans MathémaTICE.

Cet article peut être librement diffusé et son contenu réutilisé pour une utilisation non commerciale (contacter l’auteur pour une utilisation commerciale) suivant la licence CC-by-nc-sa http://creativecommons.org/licenses/by-nc-sa/3.0/fr/legalcode

Introduction

L’évaluation par compétences est à la mode dans les salons du ministère de l’Éducation Nationale depuis plusieurs années. Différentes annonces récentes, sur la mise en place d’une Conférence nationale sur l’évaluation des élèves, ou sur l’instauration d’un nouveau socle commun de connaissances au collège, confirment cette tendance.]
Dans la pratique pourtant, les choses changent peu. Si en Primaire, les enseignants évaluent souvent par compétences, particulièrement dans leurs bilans trimestriels, ce système est souvent jugé puéril et inadapté au secondaire, où le mode d’évaluation quasi exclusif reste la traditionnelle note sur 20.
Le socle commun de connaissances en place au collège, le B2I, imposent dans les textes une validation de compétences, mais dans la pratique, cela s’opère souvent sans véritable concertation, en cochant des croix en fin d’année, pour remplir des tableaux. Sans outil adapté, ni réflexion collective sur le sujet, cela apparaît pour nombre de collègues comme une consigne à appliquer, de façon bureaucratique, avec en plus, du travail supplémentaire, souvent jugé inutile.

Quoiqu’on pense de ces consignes ministérielles, et de leur application véritable sur le terrain, elles ont objectivement plongé des équipes du secondaire dans une réflexion sur les compétences. Et concrètement, de plus en plus d’équipes se tournent vers un autre mode d’évaluation dans leur pratique quotidienne. Certaines pour donner du sens à la validation du socle commun au collège par exemple, ont mis en place des outils qui permettent de synthétiser l’ensemble des compétences validées par les équipes.

Mais d’autres collègues, dont je fais partie, ont, de façon tout à fait indépendante, et parfois isolée ou minoritaire dans leur établissement, adopté, par rejet du mode d’évaluation actuel, l’évaluation par compétences. Il n’y a donc pas toujours de liens direct entre la validation du socle de connaissances au collège et l’évaluation par compétences. Le logiciel SACoche par exemple, s’il permet de valider le socle, n’a pas été conçu à cet effet, mais pour évaluer par compétences au quotidien. Et pour ma part, alors que c’est la cinquième année que je travaille par compétences, je reste très critique sur la validation du socle au collège, et je dissocie clairement ma pratique quotidienne des contraintes administratives du socle.

Mon déroulement de carrière m’a fait passer par trois établissements successifs où j’ai, à chaque fois de façon isolée au départ, mis en place cette pratique.
Cette histoire qui m’a fait présenter ma pratique à trois équipes, m’a poussé à évidemment échanger avec de nombreux collègues de façon informelle, mais aussi à animer des réunions avec des parents, à présenter ma pratique aux équipes, et donc à répondre à des questions, à affiner des arguments pour répondre aux critiques ou craintes soulevées. Au final, cela m’a transformé progressivement en un « militant » de l’évaluation par compétences.

J’avais déjà rédigé un article, il y a 3 ans, qui relatait ma première expérience. Aujourd’hui, ce nouvel article sur le sujet dépasse mon parcours personnel. Mon objectif est d’essayer de répondre aux questions de collègues hésitants ou curieux, d’apporter des arguments pour les convaincre de l’intérêt de choisir l’évaluation par compétences.

Pour clore cette introduction, je précise que cet exposé se veut sans prétention. Je ne me prétends pas spécialiste de la question et mon propos ne s’appuie que sur mon expérience et mes lectures sur le sujet. Cet article se veut une simple contribution, parmi d’autres, au débat, avec comme objectif clair de permettre à des collègues d’appréhender favorablement l’évaluation par compétences.

Avant de développer les atouts de l’évaluation par compétences, il faut commencer par revenir sur les faiblesses du système actuel. Ceux qui sont satisfaits des notations sur 20, n’ont aucune raison de poser la question d’en changer. C’est bien en réaction aux problèmes posés par celui-ci, qu’on peut s’intéresser à l’évaluation par compétences.

Petit tour critique de la notation sur 20

La note globale : Le talon d’Achille de la notation sur 20 :

La force de la note sur 20

La force de la note sur 20 (mais c’est aussi sa faiblesse, on y viendra), c’est de résumer l’ensemble d’une copie par un nombre compris entre 0 et 20.
C’est évidemment très pratique, symboliquement très fort, cela permet de hiérarchiser, de faire des moyennes, …. Cela donne en un minimum d’informations (un nombre) une information capitale sur le suivi de la scolarité d’un élève.
C’est culturellement très fort puisqu’utilisé depuis des décennies. Les parents ont eux-mêmes été notés ainsi. Ils demandent régulièrement à leur enfant qui rentre de l’école s’il a eu des notes dans la journée. Un 4, un 8 ou un 16, suffisent souvent à donner sentiment sur la qualité de son travail et à alimenter une discussion. Si la note est insuffisante, il est facile pour les parents de faire pression sur l’enfant, de punir, pour lui demander de travailler plus et d’augmenter ses résultats. Inversement, les parents sont fiers des bonnes notes de leur progéniture et les détaillent souvent à leur entourage.

Trop de précision tue la précision !

Arrêtons nous un moment sur ce premier point pour nous demander ce que l’on mesure vraiment avec ce seul nombre qui va résumer le travail d’un élève pendant 1, 2 voire 4 heures en lycée.
Compiler des savoirs pour en sortir un nombre mesure indiscutablement quelque chose. La véritable question à se poser est : que mesure ce nombre ?
Les élèves sont-ils sur une échelle du savoir à 21 marches (de 0 à 20) sur laquelle on pourrait déterminer l’échelon sur lequel ils se trouvent ? Des élèves qui auraient 13/20 seraient au 13ème échelon et celui qui n’a eu que 11/20 au 11ème ?
Tout cela est évidemment grotesque, tant les connaissances demandées aux élèves sont multiples et complexes et leur maîtrise respective très individuelle. C’est pourtant ce que tend à laisser croire le fait de résumer un long travail par un seul nombre.

Une note mesure-t-elle un paramètre bien défini ?

Établir une note globale et chiffrée, c’est tenter de mesurer une maîtrise d’un savoir. Si cette mesure est rigoureuse, elle doit être scientifique. Quand on mesure un paramètre bien défini comme la température par exemple, on donne une valeur précise (par exemple 19,5), donnée sur une échelle et unité reconnue (par exemple le degré Celsius) et établie par un outil de mesure fiable (un thermomètre).
Le talon d’Achille de notre système de notation actuel se trouve ici. Car il donne l’illusion, par l’existence même de cette note globale qui résume le savoir de l’élève, qu’une note sur 20, donne une valeur précise, sur une échelle reconnue et établie par un outil de mesure fiable, d’un paramètre bien défini.
On va voir qu’il n’en est rien. La note globale n’est ni précise, ni fiable, ni bien définie.

Un exemple, volontairement caricatural

Un professeur de mathématiques propose un devoir bilan à ses élèves avec classiquement une partie numérique et une partie géométrique. Il propose le barème suivant et voici les résultats de 3 élèves :

Élèves	Géométrie (10 points)	Numérique (10 points)	Note sur 20
Albert	0	10	10
Barnabé	10	0	10
Cunégonde	5	5	10

On observe dans cet exemple, même s’il est peu crédible sur le fond, des profils très différents parmi nos trois élèves. Albert est fort en calcul et très faible en géométrie, à l’exacte inverse de Barnabé. Quant à Cunégonde, elle semble très moyenne globalement.
Pourtant, ils obtiennent tous trois la même note 10/20.
La première remarque est qu’une même note recouvre des réalités et des profils très différents. A elle seule, elle ne veut pas dire grand-chose. Elle mesure quelque chose, mais bien malin qui peut dire précisément quoi.
La réalité, c’est qu’une note ne mesure pas un paramètre bien défini qu’on peut quantifier, mais plutôt la somme de plusieurs paramètres. C’est pourquoi elle ne permet pas, à elle seule, de se faire une opinion sur le savoir d’un élève.
Il s’agit d’une banalité que de dire cela mais alors pourquoi laisser penser que la note mesure précisément quelque chose si on accepte qu’elle recouvre des réalités bien différentes ?
A vouloir résumer par un nombre des champs différents, on gomme toute analyse précise du travail de l’élève. Bien sûr, un élève sérieux, des parents consciencieux, peuvent relire la copie, analyser les points forts et points faibles, lire les commentaires laissés par l’enseignant, et se faire un jugement précis.
Mais cela confirme que naturellement, la note sur 20 n’apporte pas ces informations, et qu’elle demande un effort au correcteur et un effort aux familles.
Il faudrait que conjointement l’enseignant exprime par écrit des commentaires qui analysent la copie et que les élèves et familles, prennent ensuite le temps de les étudier. Chacun se fera un avis sur la réalité de ce scénario. Et on peut alors se demander quelle est l’utilité alors de la note globale, puisque ce n’est plus elle, mais les commentaires qui sont importants.

Subjectivité du barème à points

On peut aussi, à partir de l’exemple précédent, imaginer un autre correcteur, tout aussi professionnel, qui affecterait une autre répartition de points au même devoir.
Un collègue proposant par exemple 12 points en calcul et 8 en géométrie, avec le même sujet précédent, favoriserait Albert au dépends de Barnabé. Albert aurait 12/20 et Barnabé 8/20.
Cela modifierait-il alors le « niveau » des élèves ?
Ceux qui ont participé à des réunions de concertations sur des barèmes savent que cette question n’est pas anecdotique. Il n’y a pas UN bon barème sur un devoir et il n’est pas toujours facile de faire consensus.
Tout enseignant a déjà été confronté au casse tête du barème à établir sur 20 points, qui amène parfois à rajouter des points par-ci, à en enlever par-là, uniquement pour tomber sur le sacro-saint 20. Il faut avoir conscience que ce bricolage imposé par le carcan du barème global a une incidence sur le résultat de l’élève.
Une note est donc indiscutablement impactée par les compétences de l’élève, mais aussi par le barème.
De la même manière, rajouter un exercice pour compléter le sujet, pour qu’il occupe une heure, impacte le résultat. Pour finir avec notre exemple précédent, si un collègue complète son sujet par de la géométrie, il favorise Barnabé, et inversement si c’est du calcul.
S’intéresser à une note globale, c’est donner beaucoup d’importance à la constitution du sujet en lui-même, qui sont des facteurs impactant le résultat.

Avec cette première approche, on observe déjà qu’une note globale mesure indiscutablement quelque chose en lien avec les compétences d’un élève mais elle dépend beaucoup d’une l’interaction particulière entre l’élève et le correcteur.

Donne moi ton barème, je te donnerai ta note

Pour illustrer cela, avec un exemple moins caricatural, j’ai en mémoire, alors que j’étais professeur principal d’une classe de cinquième, d’un rendez-vous demandé par une maman, à propos d’une copie de géographie de son fils. Il s’agissait de compléter une carte de France, avec 20 données (grandes métropoles, régions, fleuves, …), chacune avec une exigence de légende spécifique (en capitale pour la région, en bleu pour les fleuves, …).
La maman furieuse me montre la copie de son fils, qui avait 19 bonnes réponses, mais n’avait que 13 points car 6 bonnes réponses étaient mal légendées (écrites en minuscules, au crayon de papier). La collègue ne donnait un point qu’à une bonne réponse bien légendée. 0 pour toute autre réponse.
La maman de m’expliquer : « Mon fils a appris sa leçon, il a travaillé et a bien répondu. Il n’a que 13 alors qu’il mérite 19. J’exige une nouvelle correction »
J’ai posé le problème, sans prendre parti, à la collègue plus tard, afin qu’elle juge la suite à donner ou non à la réclamation de la maman.
J’ai appris par la suite que la copie avait été ré-évaluée à 19/20, comme le demandait la maman.
Je ne raconte pas cet épisode pour dénoncer la pression parentale, qui ici revendique et obtient le résultat souhaité pour une évaluation. Clairement, on peut se demander qui évalue dans cette histoire.
Mais cet exemple est intéressant sur un autre terrain, sur lequel il me semble important d’insister. La collègue évaluait clairement deux compétences dans son devoir. Des connaissances géographiques, et un savoir faire, la capacité à respecter des consignes, à légender une carte.
Cet élève excelle dans les connaissances mais néglige les consignes et la rigueur. Il est illusoire de vouloir résumer un tel antagonisme par un nombre seul.
Si 13/20 me semblait très injuste pour l’élève, je trouve le 19/20 tout aussi absurde puisqu’il revient à négliger le savoir-faire. On pourrait discuter longtemps d’un barème plus adapté, pour déterminer quelle note est la plus adaptée entre 13 et 19. Mais cela revient à disserter sur le sexe des anges.
Il y a clairement deux items distincts à évaluer dans un tel devoir, toute synthèse est réductrice et discutable.

Globaliser une note, c’est dissimuler les scores de l’élève derrière un nombre fétiche

Caricature d’un dessin de Gaston Lagaffe. On peut avoir 16/20 et être en danger....

Pour terminer cet aspect par un parallèle médical, que penser d’un laboratoire d’analyses qui rendrait une note sur 20 à un bilan sanguin d’un patient ?
Vaudrait-il mieux avoir un bilan à 13/20 ou à 15/20 ?
La seule question à se poser pour le patient, c’est de connaître les éléments qui posent problèmes, à quel degré et que faire pour les améliorer. Seul un bilan détaillé permet cela. Ce que propose d’ailleurs tout laboratoire d’analyses.
Que penser d’un laboratoire qui estimerait que le taux d’hémoglobine vaut plus que la mesure du cholestérol dans l’établissement du bilan global ?
En changeant de laboratoire, on obtiendrait un bilan différent ?
De la même manière, imaginer qu’un nombre puisse résumer le travail d’un élève durant une heure, sur plusieurs exercices, abordant des chapitres différents relativise la portée de ce nombre quand on y réfléchit bien.
Il mesure quelque chose, mais personne ne sait bien quoi, ni ce que cela veut dire. A condenser trop d’informations en un seul nombre, la note devient un nombre flottant, sans véritable signification, qui n’existe que pour lui même. Les élèves entre-eux n’échangent que cela « combien tu as eu ? » et l’information « j’ai eu 14/20 » suffit.
On se moque alors du sujet, de ce qui a été réussi ou non, on ne retient que la note, qui joue un rôle social majeur, particulièrement pénalisant pour les élèves en difficultés.

La note, une mesure précise ? :

Une dispersion entre les correcteurs

Caricature issue d’un journal tunisien.

Jacques Nimier, qui vient de décéder, résumait sur son site les principes de la docimologie. Il semble malheureusement que des pages aient disparu suite à son décès. J’avais absorbé une page très intéressante que je propose ici
Il relatait par exemple une expérience de multicorrection de copies d’agrégation d’histoire :
« 166 copies ont été corrigées par 2 professeurs travaillant séparément, sans connaître leurs appréciations respectives.Tous les deux avaient une longue expérience et corrigeaient méticuleusement. (...). La moyenne des notes du premier correcteur dépassait de près de deux points celle du second. Le candidat classé avant dernier par l’un était classé second par l’autre. Les écarts de notes allaient jusqu’à 9 points. Le premier correcteur donnait un 5 à 21 copies cotées entre 2 et 14 par le second ; le second donnait un 7 à 20 copies cotées entre 2 et 11,5 par le premier. La moitié des candidats reçus par un correcteur était refusée par l’autre. »
Il citait aussi l’étude de l’Institut de Recherche sur l’Enseignement des Mathématiques de Grenoble sur un échantillon de 6 copies photocopiées de mathématiques (niveau 3ème) soumises à 64 correcteurs, avec un barème, très précis, sur 40 points.
Les résultats confirment ceux de l’enquête précédente, (..). La dispersion des notes atteint près de 20 points. »

Il faut donc rester humble face au jugement qu’un correcteur porte sur un travail d’élève et être lucide sur la subjectivité d’une correction. Il ne s’agit pas ici de pointer toutes les raisons qui expliquent ce phénomène de dispersion importante. Mais il faut en reconnaître la réalité quand on corrige.

La précision du barème n’y change rien

Ce qui surprend souvent, c’est que même en mathématiques, une science exacte, avec des résultats justes ou faux, on obtient les mêmes dispersions que dans les matières littéraires, réputées plus sensibles à la subjectivité.
De même, la prévision d ’un barème n’offre pas de meilleur garantie. Je me rappelle avoir corrigé l’épreuve de mathématiques du concours de professeur des écoles. Nous corrigions en binôme, sans nous connaître, et en théorie en double aveugle, sans annoter les copies. Avec un barème évidemment très précis, nous devions noter dans une grille nos points. Puis à la fin, comparer les deux corrections.
Je conserve un très mauvais souvenir de la première matinée où nous avions respecté cette consigne, qui nous amenait à discuter longuement sur chaque copie, sur des quarts de points, car nous étions rarement d’accords.
En toute honnêteté, pour être plus efficace, nous avons terminé notre travail, comme les autres binômes autour de nous, non plus en double aveugle, mais en corrigeant la deuxième fois avec le barème du premier, pour éviter les erreurs grossières.
J’ai eu connaissance d’études expliquant que la dispersion des notes était moins importantes dans des copies « notées à la volée », où on demande au correcteur d’évaluer une copie sans barème en 2 minutes, qu’avec les mêmes copies corrigés classiquement avec un barème précis.

D’autres facteurs de dispersion

Quand on parle de dispersion de notes, on n’aborde évidemment pas d’éventuelles négligences ou erreurs du correcteur.
Ce qui est troublant, c’est que des expériences sur un même correcteur, corrigeant deux fois les mêmes copies, à des moments différents, montrent aussi des résultats étonnants avec de fortes dispersions. Il ne s’agit donc pas seulement de tempéraments ou personnalités différentes.
Un autre phénomène qui se surajoute est qu’un paquet de copie est rarement corrigé en une fois. Chaque moment différent de correction impactera la notation, selon la fatigue, l’humeur, l’environnement, …
De même, l’appréciation des premières copies, dans lesquelles on découvre des erreurs, on s’étonne de ce qu’on lit, est différente de celles de fin de paquet, où la réaction est atténuée par le nombre. L’appréciation est aussi impactée par l’ordre dans lequel sont classées les copies.

Je n’aborde pas ici la fameuse constante macabre développée par André Antibi, qui soulève de vraies questions sur les pressions sociales exercées sur les correcteurs, qui les amènent à s’imposer inconsciemment les résultats qu’on attend d’eux, avec des moyennes acceptables socialement. Je renvoie aussi au lien vers la page de Jacques Nimier sur le sujet, qui pointe des expériences troublantes sur l’influence du sentiment du correcteur. En vantant un paquet de copies à un correcteur, on obtient une moyenne supérieure, au même paquet proposé à un collègue à qui on a dévalorisé les élèves.

Une caricature qui s’inspire des réflexions d’André Antibi sur la « constante macabre »

La tromperie de la notation sur 20

Les défenseurs de la notation actuelle argueront que ce phénomène de dispersion est valable pour toute forme d’évaluation, que cela ne concerne pas seulement la notation sur 20.
Certes, c’est vrai. Mais on touche pourtant là, la principale faiblesse de la notation sur 20.
Elle fait croire, par sa nature, par l’aspect compact de son bilan chiffré, que la note a une portée précise et scientifique et qu’elle mesure un niveau. Ce qu’infirme toutes les enquêtes.
Prenons un nouvel exemple médical.
Un patient qui fait un bilan de santé chez son médecin, revient avec une mesure de sa tension, de son pouls, de sa masse corporelle, … qui sont des données précises dont on peut penser qu’un autre médecin donnerait les mêmes dans les mêmes conditions. On peut donc établir un diagnostic à partir de ces données précises.
La note sur 20 donne cette illusion de précision avec son caractère chiffré. Mais c’est une duperie. Elle ne mesure que subjectivement une interaction entre un correcteur et un élève.
Deux correcteurs, pourtant sérieux et professionnels, donnent deux notes différentes à la même copie. Avec des écarts pouvant être très importants.
Que penser d’une médecine dont un patient trouverait un bilan (une masse, tension, …) différent selon le médecin qui l’ausculte ? Comment établir un diagnostic précis ?? Parlerait-on de médecine scientifique ?

Non plus une note, mais des notes !

Évolution des notes

Dans les analyses de conseil de classe, les enseignants sont amenés à porter des jugements sur les élèves et à partir de quelques notes, la tentation est grande d’extraire une tendance.
Or puisque l’enseignant suit une progression, les évaluations portent légitimement sur des notions différentes.
Prenons un nouvel exemple caricatural, d’un enseignant de mathématiques qui évaluerait trois fois ses élèves. En calcul pour le premier devoir, en mélangeant calcul et géométrie pour le deuxième, et uniquement en géométrie pour le troisième.

	Devoir 1	Devoir 2	Devoir 3
Sujet	Calcul	Calcul/Géométrie	Géométrie
Barnabé	3	11	16
Cunégonde	16	11	3

La lecture des notes horizontales, chronologique, montre que Barnabé progresse beaucoup, que Cunégonde s’effondre. Mais une lecture verticale, thématique, montre des domaines de compétences différents selon les individus.
La culture de la note, le fétichisme des moyennes amène souvent à une lecture uniquement horizontale. On compare les nombres obtenus, en essayant d’y voir une tendance.
On pourrait imaginer un collègue inversant sa progression, qui aurait des évolutions exactement opposées, avec Cunégonde en progrès et Barnabé qui s’effondre.
Il faut donc rester prudent sur les analyses effectuées à partir de suites de notes. Car même en admettant qu’elles mesurent chacune quelque chose de précis, ce dont je doute, on s’accordera pour dire qu’elles mesurent souvent des apprentissages différents. Que vouloir analyser des tendances revient à faire de la numérologie.

Et les moyennes ?

illustration de Marc Chalvin tirée de Laura Jaffré « Tout ce que vous pensez des profs et ce qu’ils pensent de vous » ed. La Martinière

Il y a une confusion populaire importante sur la signification d’une moyenne. Ce paramètre statistique n’est ni une norme, ni un objectif. Si le salaire moyen augmente, culturellement, on interprète facilement que globalement tout le monde gagne un peu plus, ce qui n’est pas prouvé. Il y a une escroquerie sur l’interprétation qui est faite de la notion de moyenne, indépendamment des notes.
Et une moyenne de notes n’échappe pas à cette confusion. Elle ne donne pas le niveau moyen d’un élève. Une moyenne de classe ne donne pas un objectif ni une norme. Ces notions n’ont d’ailleurs pas de sens.
Il y aurait beaucoup à dire sur la cuisine propre à chaque enseignant pour sortir une moyenne trimestrielle, avec des coefficients très subjectifs qui impactent sensiblement les moyennes. Selon l’importance qu’un enseignant donne à un devoir, en fonction du coefficient 1 – 2 ou 3 qu’il y mettra, et cela est sa liberté pédagogique qui peut avoir sa cohérence, un élève peut voir sa moyenne évoluer sensiblement, dépasser 10 ou baisser en dessous, uniquement en fonction de critères très discutables.

Voici un exemple, avec les résultats de trois élèves aux trois évaluations d’un trimestre en 3ème :

Imaginons maintenant que trois correcteurs différents, d’accord sur les notes précédentes, calculent les moyennes :

Monsieur A ne hiérarchise pas les devoirs.
Monsieur B hiérarchise fortement les devoirs.
Madame C qui n’accentue que le Brevet Blanc.

Avec cette pondération :

Coefficients	Interro	DS	Brevet Blanc
Monsieur A	1	1	1
Monsieur B	1	2	3
Madame C	1	1	2

Notes	Interro	DS	Brevet Blanc		Monsieur A	Monsieur B	Madame C
Albert	11	7	15	Moyenne	11	11,7	12
Barnabé	6	12	14	Moyenne	10,7	12	11,5
Cunégonde	15	14	6	Moyenne	11,7	10,2	10,3

Selon la pondération, l’élève qui aura la meilleure note sera tantôt Albert, tantôt Barnabé, tantôt Cunégonde.
Une moyenne est donc basée sur des notes dont la précision est très discutable. Elle est ensuite pondérée par des coefficients subjectifs. Cela délivre un nombre, souvent donné au dixième près comme pour attester de sa rigueur et de sa précision duquel on tire des conclusions importantes pour l’élève...

Un clip qui relativise l’usage de la moyenne

Les moyennes générales

On ne parlera pas longuement ici des moyennes générales qui sont souvent le sésame pour le passage. Un 12 en anglais compense-t-il un 8 en Français ?
Heureusement que les pondérations ont disparu dans le calcul de la moyenne trimestrielle, pour lutter contre une hiérarchisation malsaine entre matières.
Mais à bien y regarder, la pondération existe encore et elle renforce maintenant à l’inverse les matières à faible volume horaire. On peut comprendre qu’un enseignant de musique qui n’a une heure de cours par semaine avec ses élèves, mette moins de notes qu’un professeur de maths. Mais au final, s’il y a 4 épreuves d’une heure en maths dans le trimestre et une seule en musique, celle de musique impactera 4 fois plus (à coefficients égaux) la moyenne trimestrielle que les épreuves de maths.
Pour anecdote, dans mon ancien établissement, après des mois d’absence, la collègue de musique est revenue faire cours en juin et a donné in-extremis une note (entre 16 et 19 à chaque élève), ce qui a donc constitué leur première moyenne en Éducation Musicale de l’année.
Loin de moi l’idée de critiquer la collègue et son évaluation. Mais cette note avait autant de poids dans la moyenne que l’ensemble des devoirs de français du trimestre. Et le chef d’établissement était satisfait que mes moyennes aient remonté en fin d’année….
Bien sûr cette situation était caricaturale, mais elle révèle la prudence à observer sur cette moyenne trimestrielle sortie de l’ordinateur, qui donnent une illusion d’exactitude et de rigueur.

Un outil de classement

La note sur 20, la moyenne trimestrielle, n’apportent pas d’éléments pédagogiques sérieux. Le pire étant encore la moyenne de classe qui représente dans l’inconscient collectif, une sorte de norme à atteindre. On n’étudie pas l’élève par rapport à son savoir, en lien avec les objectifs de l’année, mais par rapport au groupe classe auquel il appartient. L’élève n’est pas mesuré sur l’échelle de ses compétences, mais comparé aux autres.
Rien de surprenant à cela, car les notes servent avant tout à classer. La note sur 20 est culturellement importante en France et daterait de l’apparition du Baccalauréat moderne en 1890. Ce qui fait déjà relever qu’une note sommative, qui avait pour objectif de sanctionner l’obtention ou non d’une épreuve finale de la scolarité, a été érigée progressivement en mode d’évaluation de base.
Cette longue histoire de la notation sur 20, rend suspecte toute proposition alternative. On tombe facilement dans le dénigrement en se faisant accuser de vouloir casser « l’école de la République » en touchant à son système de notation historique.
Or c’est précisément pour lutter contre un système qui broie des élèves, que des enseignants cherchent des alternatives à la notation sur 20.
Car qui n’a jamais eu de 5/20 (ou moins !) ne mesure pas le désespoir des élèves en échec scolaire. Comment l’annoncer à sa famille ? A ses copains ? Quelle image donne-t-on de soi aux autres avec de telles notes ? Et quelle image se donne un adolescent de lui-même quand il a travaillé et que la mauvaise note tombe ?

La note sanction

On ne développera pas le travers pourtant bien fréquent de l’utilisation de la note pour sanctionner un élève. Pourquoi mettre un 0/20 à un élève qui triche à un devoir ? On mélange un problème de vie scolaire, de non respect de règlement et une mesure de compétences.

illustration de Marc Chalvin tirée de Laura Jaffré « Tout ce que vous pensez des profs et ce qu’ils pensent de vous » ed. La Martinière

Quelle signification peut avoir la moyenne de ces élèves ?
Et les interrogations surprises ? Des enseignants se servent de sa menace pour exercer une pression quotidienne sur les élèves, les forcer à travailler régulièrement.
Quel sens peut avoir une note, prise à froid, sans que les élèves soit prévenus ?
Quel enseignant accepterait qu’un inspecteur se pointe sans prévenir un matin dans sa classe ?
L’enseignant est-il un gendarme qui cherche à placer un radar mobile à un endroit stratégique pour flasher le maximum d’automobilistes ?
Ou est-il un moniteur d’auto-école, qui apprend à conduire dans la durée à des jeunes qui découvrent le code de la route ?

Actuellement, l’évaluation est vécue comme une punition, une source d’ennui, une crainte, qui provoque angoisse et stress chez les plus faibles.

La note punition

La note est tellement devenue un outil pénalisant pour les élèves, entre les mais de l’enseignant, que des collègues l« utilisent même pour punir un chahut. Avec le célèbre »si vous ne vous taisez pas, je vous colle une interro surprise !".
Nous ne sommes plus dans l’idée d’évaluer les élèves pour qu’ils se situent face à leur apprentissage, qu’ils se fassent une idée de leur acquisition de compétences. Clairement, la note devient un outil répressif entre les mains de l’enseignant, qui en l’utilisant ainsi, résout un problème sur le moment, mais discrédite sa matière et dénature l’idée d’évaluation dans le tête de ses élèves.

La note couperet

L’aspect couperet, nombre fétiche entre les mains de l’enseignant qui tombe brutalement sur l’élève pose véritablement un problème pédagogique.
Durant la dizaine d’années où j’ai évalué traditionnellement, avec des notes sur 20, combien d’élèves ai-je fait pleurer, malgré moi, en rendant des devoirs ? Je revois le désespoir de ces élèves découvrant brutalement, avec la note rendue, qu’ils avaient raté ce qu’ils croyaient avoir réussi. Je me rappelle les stratégies que je mettais en place pour annoncer en amont et discrètement à ces élèves leur mauvaise note, pour les préparer et éviter si possible ces crises de larmes publiques.
La détresse de ces élèves vient de la portée exagérée de ce résultat, incompréhensible à leurs yeux, qu’il faudra non seulement annoncer en société et mais qui impactera la moyenne, quoiqu’il arrive ensuite, et donc l’orientation. Je revois encore cette fille de 3ème à qui je rendais un 4/20, qui restait inconsolable, tant son espoir de devenir un jour vétérinaire s’éloignait selon elle, à cause de ses résultats en maths.

La note figée et l’apprentissage dynamique

Avec le classique « devoir de fin de chapitre », l’évaluation formative disparaît du processus d’apprentissage. On amène les élèves à se présenter à un examen à chaque évaluation, à passer le bac à chaque DS, avec réussite ou échec, sans droit à l’erreur ni lien direct avec le travail.
Une sorte de double peine pour les élèves en difficultés, qui ne pousse pas à suivre une correction ou à reprendre le devoir plus tard, puisque la sanction est tombée. A quoi bon retravailler un devoir raté puisque le rythme amène déjà un nouveau chapitre et son prochain devoir en perspective.

J’aime beaucoup cette caricature, réalisée par un élève, et publiée dans « évaluer sans dévaluer » de Gérard de Vecchi Ed Hachette. Livre que je recommande vivement.

un exemple

Imaginons, deux élèves qui rendent deux devoirs, sur le même sujet, à une semaine d’intervalle :
Raoul ne connaissait pas la notion abordée lors de la première évaluation. Il a été sanctionné par une note sévère de 2/20, reflétant ses lacunes nombreuses.
Simone, elle, s’en sort moyennement avec 11.
Lors de la nouvelle évaluation sur le même sujet, Raoul, peu importe les raisons, a bien compris cette fois-ci et s’en sort avec 18. Simone reste stable avec 11.

	Devoir 1	Devoir 2
Raoul	2	18
Simone	11	11

Qui a la meilleure moyenne ? Qui est celui qui a le mieux compris ?

C’est Simone qui a la meilleure moyenne (11 contre 10 pour Raoul) alors que clairement, Raoul est celui qui a le mieux compris. Certes, il lui a fallu plus de temps pour comprendre, il a été en difficultés à un moment, et la moyenne lui tient rigueur de ce retard dans l’apprentissage.
La note sur 20 et son calcul de moyenne, ne donnent donc pas droit à l’erreur, ils pénalisent les fautes. Une note est une marque indélébile qui comptera dans la moyenne, peu importe si on progresse ensuite. C’est là sans doute le facteur le plus injuste, le plus démobilisateur de ce système de notation.

Pas de droit à l’erreur

Apprendre, c’est se tromper, recommencer, progresser, se tromper encore ainsi de suite. Il n’est pas ici le propos d’aborder les méthodes de travail mises en place par les élèves et incitées par le système, il y aurait trop à dire. Mais les faits montrent que des élèves découvrent lorsqu’on leur rend leur évaluation, qu’ils n’avaient pas compris. Ils ont été, pour certains, dans l’illusion du savoir, par trop peu de travail, ou par un travail inadapté, peu productif … Peu importe, car pourquoi l’absence de travail devrait-elle être pénalisée sans pouvoir se racheter ?
La seule démarche pédagogique est de partir de ses erreurs, de les analyser, pour poursuivre son chemin. La note sanction sur 20 ne stimule pas cela au contraire, elle le freine en pénalisant les fautes au lieu de susciter un travail sur les erreurs. La sémantique est importante, puisqu’on parle bien souvent de fautes (manquement à une règle ou à une norme) et non d’erreurs .
On peut se demander où est l’intérêt de pénaliser un élève qui comprend une notion deux semaines après les autres, après l’évaluation ? Sa scolarité future en sera-t-elle impactée ? Sera-t-il moins apte à suivre l’année suivante ?
Quel est le problème qu’un enfant apprenne à marcher plus tardivement que son frère ou sa sœur ? Ce qui compte, c’est qu’il marche. Et une fois cela acquis, plus personne ne se rend compte du retard d’apprentissage initial.
Chacun a son rythme, ses priorités, et l’objectif du pédagogue est de faire avancer chaque élève à sa vitesse, en le stimulant au maximum.
La note sur 20 peut être utile pour des concours, pour des validations d’examens à épreuves finales. En évaluation sommative.
Mais au quotidien, l’évaluation devrait être un outil intégré à l’apprentissage, qui pointe les savoir-faire et les lacunes, et offre des perspectives pour progresser. L’erreur est un droit, elle est même indispensable pour une bonne compréhension. Un enseignant doit souligner les erreurs et non sanctionner les fautes, comme le fait un correcteur à un examen, qui établit une note sanction.
L’évaluation par compétences permet cela au quotidien. En ne distribuant pas des points, mais en donnant un avis sur chaque compétence évaluée, on change le rapport à l’évaluation.

L’évaluation par compétences

– Le principe

Pas une note, mais des notes !

Évaluer par compétences, c’est s’émanciper de la contrainte de poser une note globalisante sur une copie, avec tous les travers qu’on lui a trouvé. On continue de noter les élèves, mais à la place d’une note qui résume une copie, on offre une multitude de notes ciblées sur des points précis.
Pour reprendre le parallèle avec l’analyse de sang, on procède comme le laboratoire qui rend au patient un listing de tests effectués, avec les résultats ciblés, que l’ont peut situer chacun sur une échelle de ce qui est attendu.
L’élève reçoit une copie sur laquelle il peut se faire un avis, item par item, sur sa réussite ou non.
Bien que plus abstraite au premier abord, une telle copie, sans la note globale est bien plus précise et utile pour retravailler.

Pas une note précise mais un indicateur

Tout ce qui a été dit sur la dispersion des notes doit rendre humble sur notre capacité à évaluer précisément des élèves. Aussi, l’évaluation par compétences donne plus une indication globale qu’un décompte précis.
Chaque item est évalué sur une échelle à quatre barreaux, volontairement caricaturale, qui permet de positionner plus facilement l’élève. La Web application SACoche, avec un jeu de couleurs pour une meilleure lecture à l’écran, propose par défaut Vert-Vert à l’élève qui maîtrise parfaitement la notion, Vert à celui qui a globalement compris la notion, Rouge à celui qui n’a pas tout assimilé, et Rouge-Rouge à celui qui n’a pas du tout compris.
On reste bien dans des notes, et il est faux de dire qu’évaluer par compétences supprime les notes. Elle les multiplie au contraire, en les ciblant bien mieux.
Au lieu d’une note globale qui donne une illusion de précision, l’évaluation par compétence propose plusieurs indicateurs, qui positionnent chacun l’élève face à un savoir précis.
Le problème n’est pas de compter le nombre de bonnes réponses en un temps limité, ce que la notation sur 20 amène à réaliser, mais à porter un jugement global, plus fin sur des maîtrises ou non de savoir-faire, compétences, ...
L’évaluation par compétences permet de ne plus mettre 10/20 à un élève qui réussit parfaitement la moitié de la copie, et ne fait pas la deuxième. Elle cible les domaines maîtrisés et les domaines à retravailler.
Les bilans proposés par SACoche sont d’une très grande lisibilité et permettent de se faire une idée précise pour établir une synthèse des compétences d’un élève.
Élèves, parents et enseignants ont à leur disposition un outil remarquable qui pointe des domaines de difficultés, qui cartographie les compétences non assimilées et permet de lancer aisément des remédiations.

Une autre approche de l’évaluation

En sortant du carcan du barème sur 20, l’enseignant peut imaginer, en travaillant par compétences, de multiples formes d’évaluations, libéré du traditionnel devoir d’une heure. Les collègues qui s’y essaient en conservant le barème sur 20 sont obligés de pondérer faiblement un petit devoir, ou de ne le compter que sur 8 puis de lui ajouter d’autres notes.
En travaillant par compétences, on peut facilement faire une évaluation courte sur deux items, puisque l’aspect global n’existe plus. On peut même évaluer « à la volée » des élèves sur un item précis en cours, sur un travail écrit, à l’oral, .., avec une souplesse appréciable. L’enseignant n’est plus obligé de trouver 20 points à distribuer pour évaluer.
On peut aussi revenir plusieurs fois sur le même sujet, sans perturber la cohérence des résultats finaux. En évaluant trois fois le théorème de Pythagore, on cumule trois évaluations sur les items concernés, et au final il n’en sort qu’un bilan, pas plus important que les items de calcul littéral évalués par exemple une seule fois.
A l’inverse, en notant sur 20, un enseignant pondérerait fortement le théorème de Pythagore dans sa moyenne en l’évaluant trois fois plus que le calcul littéral.

Une pondération des items

Pour évaluer, l’enseignant détermine le degré de maîtrise de l’item demandé, en lui attribuant une couleur que SACoche transforme en pourcentage d’acquisition. Vert-Vert donne 100 %, Vert donne 67 %, Rouge donne 33 % et Rouge-Rouge 0 %. Au final, chaque item évalué se voit attribué un pourcentage d’acquisition.
On pourra établir ainsi, mais pas nécessairement, un bilan de ces scores d’acquisitions, qui donneront une moyenne des résultats. En ramenant ce pourcentage sur 20, on peut ainsi établir une note moyenne, dont il est question plus loin.

Copie d’écran d’un bilan établi par SACoche

La mise en place du référentiel de compétences, décidé par l’enseignant, permet de lister sereinement en début d’année les attendus. Il est possible de pondérer certains items que l’on juge plus importants que d’autres. On peut trouver cohérent de moins comptabiliser au final « Rendre une copie propre » que « utiliser le théorème de Pythagore ». Bien évidemment cette pondération est subjective et discutable, mais elle est clairement annoncée en début d’année, repose sur des choix pédagogiques et une cohérence globale dans le référentiel.
A l’inverse de toutes les pondérations de notes dont nous avons parlé précédemment. Un élève qui valide le théorème de Pythagore en interro surprise « gagne » moins de points que s’il le valide dans un devoir commun, si le dernier est sur-pondéré. Cela n’a pas de sens pédagogique, d’affecter la réalisation ou non d’une compétence, d’un coefficient dépendant au final du jour de l’épreuve.

La double notation : Une fausse-bonne idée

Une solution intermédiaire consiste à conserver la notation sur 20 mais de lui adjoindre une grille de compétences. J’avais déjà relaté mon expérience de double notation (compétences/points) avec un avis très négatif dans mon premier article sur le sujet. Elle reste à mon sens une solution très insatisfaisante.
Outre l’aspect chronophage pour le correcteur, qui corrige deux fois ses copies, avec des grilles le lectures différentes, la note sur 20 écrase tout puisqu’elle détermine à elle seule la moyenne. Les relevés de compétences offrent une lisibilité intéressante à l’élève ou à ses parents sur ses connaissances et lacunes, mais ils ne sont pas l’élément qui impacte directement la moyenne, et donc le bilan de l’élève.L’absence de prise en compte de ces résultats dans la moyenne altère nécessairement l’intérêt que les élèves et parents peuvent y porter. Cela a tendance à mon avis à devenir un outil gadget, entre les mains d’un enseignant dévoué, sans véritable enjeu pour les familles. Il est souvent mis en place de façon sérieuse par des enseignants pour faciliter la validation du socle au collège.
Mais en caricaturant, quand il y a double notation, c’est pour le double public : les parents et le bulletin s’intéressent à l’une, et l’enseignant à l’autre.
L’idée de cumuler les deux modes d’évaluation pour satisfaire tout le monde est une mauvaise piste, puisque la notation sur 20 pose en elle-même problème pour évaluer des élèves en apprentissage, comme j’ai tenté de le montrer dans la première partie.

Le droit à la différence

Les enseignants sont de plus en plus confrontés à des élèves sujets à des troubles dys- nécessitant des dispositions particulières, notamment lors des évaluations. Il n’est jamais très simple de laisser un temps supplémentaire lors de devoirs calés dans l’emploi du temps, et au final, l’adaptation d’un devoir n’est donc pas toujours aisée.
L’évaluation par compétences permet de cibler les items fondamentaux, à évaluer en priorité. On peut plus facilement construire un sujet en conséquence, sans se soucier du barème global. On peut par exemple demander aux élèves d’aller aussi loin qu’ils le peuvent, et de clore le barème là où ils terminent.
De même un élève plus lent, qui ne termine pas un sujet, peut, selon l’appréciation du correcteur, ne pas être évalué sur les items non traités. Reste évidemment à distinguer le « pas eu le temps » du « pas compris », ce qui n’est pas toujours aisé. Mais l’approche par compétences permet de ré-évaluer les élèves concernés sur les items manquants ultérieurement. On peut penser qu’au stade de l’évaluation en formation continue de nos élèves, le temps ne doit pas être un paramètre trop pénalisant.
Régulièrement des élèves paniquent en fin d’épreuve, par peur de manquer de temps. Le discours rassurant, leur rappelant cette approche, diminue le stress et permet de finir sereinement le devoir.
Rien n’empêche de pointer négativement un item sur la capacité à terminer une épreuve dans les temps, ce qui est différent que d’évaluer négativement une compétence non abordée.

Le stress

Dans mes retours d’expérience, ce qui revient souvent, c’est la sérénité face aux évaluations pour les élèves les moins à l’aise. En supprimant les facteurs sanctions/punitions de l’évaluation, on ne conserve que le fond.
Je leur prend souvent comme exemple, qu’une évaluation est une photo, un instantané, sur une compétence. Il se peut que la photo soit ratée, on cherchera alors à comprendre pourquoi et on en refera une.
Cette approche enlève la crainte de voir la photo du jour, surtout si on pense qu’elle sera ratée, exposée en poster, comme peut l’être une note sur 20.

– Les remédiations

La clé de voûte de l’évaluation par compétences.

Permettre à l’élève de se faire ré-évaluer sur les compétences de son choix après un échec.
Bien sûr, on peut ré-évaluer des élèves, en notant sur 20. En reproposant une nouvelle évaluation, après un mauvais devoir. Mais cela pose deux problèmes insolubles :
Remettre un devoir sur 20 suppose un nouveau sujet comprenant plusieurs compétences. Mais un barème sur 20 ne permet pas à l’élève d’être à l’initiative de cette démarche, ni de la cibler. On reste dans du global et cela n’aide pas l’élève à cibler ses lacunes.
D’autre part, la première note sur le sujet étant comptabilisée, elle pénalise l’élève quels que soient ses progrès, comme nous l’avons vu pour Raoul qui passait de 2 à 18. Elle démotive l’élève en difficultés qui voit ses erreurs marquées au fer rouge dans le relevé de notes.
L’approche de l’évaluation par compétences est très différente. En proposant des remédiations individualisées et ciblées, le logiciel SACoche donne une plus-value indiscutable à cette approche.

Le fonctionnement :

Après une évaluation, les élèves choisissent les items qu’ils décident de retravailler. Des liens Internet, intégrés aux items, dans le bilan de compétences de l’élève, envoient vers des pages établies par l’enseignant, pour permettre à l’élève de retravailler la notion en question. Il a donc les moyens de revoir les notions chez lui, avec son cours évidemment, mais aussi avec des exercices interactifs, des vidéos, ...
Quand il se fait ré-évaluer, il ne travaille que sur les items qu’il a sélectionnés. Ce qui fait que 20 élèves d’une classe qui ont formulé des demandes peuvent avoir 20 sujets différents à traiter. Cela demande un peu d’organisation, et il n’y a pas de modèle pour mettre en place ces remédiations. Dans la pratique, cela fonctionne bien, SACoche délivrant le programme pour chaque élève, en fonction de sa demande. Il est juste nécessaire à l’enseignant de construire une réserve de sujets sur les items demandés.

Le principe : valorisation de la nouvelle tentative :

Par défaut, SACoche propose un algorithme de calcul qui bonifie chaque nouvelle tentative, en doublant sa pondération. La première évaluation d’un item compte coefficient 1, la deuxième compte coefficient 2, la troisième coefficient 4. Cela est évidemment paramétrable mais l’idée est de favoriser la nouvelle tentative, d’accepter le droit à l’erreur. Avec ce mode de calcul, chaque nouvelle évaluation d’un item compte plus que la somme des précédentes. Il est donc possible à un élève ratant trois fois un item, de redemander une quatrième fois, et d’obtenir une moyenne pour cet item qui soit favorable.

Perte de temps ?

Bien sûr, ces remédiations prennent du temps. Des collègues y voient un point faible, expliquant que cela pénalise l’avancée du programme. C’est une évidence qu’une remédiation de 10 minutes ne fait pas avancer le programme. Mais quel intérêt à avancer seul pour clore un programme ? Ces 10 ou 15 minutes consacrées aux remédiations, dont la fréquence est à définir par chacun, motivent les élèves en difficultés à reprendre chez eux ce qu’ils n’ont pas compris pour se faire ré-évaluer dessus. Cela les remet dans une dynamique de travail, les mobilise pour ne pas décrocher. Ce sont sans doute les 10 ou 15 minutes les plus rentables du cours au final. Grâce à elles, l’élève devient acteur de son savoir, il a les outils pour rebondir après un échec.

Disparition de l’effet « tiroir »

Un élève en difficultés, à qui on rend une mauvaise note sur 20, sur un devoir de fin de chapitre, a tendance à ranger sa copie dans un tiroir, en essayant de se rattraper pour le prochain devoir. Mais rien ne le pousse à retravailler ce qu’il n’a pas compris.
Avec les remédiations dont on vient de parler, il est possible de se faire ré-évaluer toute l’année sur toutes les compétences.
Un échec ne doit donc plus rester caché dans un tiroir, comme on cache la poussière sous le tapis. L’élève possède les outils pour reprendre ces notions et être valorisé s’il progresse.

– Une révolution culturelle

Un regard positif sur l’évaluation

Plus globalement, le jugement de l’enseignant sur la copie devient alors véritablement celui d’un accompagnateur, d’un entraîneur, qui pointe les problèmes, les incompréhensions, en donnant la possibilité d’y revenir plus tard. L’esprit comptable du correcteur qui compte ses points pour appliquer son barème s’éloigne avec cette approche. Un regard plus global sur la copie, ne se focalisant pas sur le résultat mais sur la démarche, qui essaie de mesurer le degré de compréhension et ne se satisfait pas de distribuer des points, change notablement l’approche de la copie.
On s’intéresse beaucoup plus finement à la personnalité de l’élève, pour essayer de comprendre son raisonnement, ce qu’il peut avoir en tête à travers sa trace écrite.
Enfin, pointer des lacunes, ce n’est plus sanctionner ni stigmatiser, mais c’est soulever un problème et ouvrir la porte pour trouver des solutions.

Apprendre à apprendre

La principale difficulté du pédagogue, c’est de donner des méthodes de travail efficaces aux élèves. Et cela n’est pas assimilé, ni au collège, ni même au lycée. Les élèves copient beaucoup sans comprendre, pensent que travailler c’est écrire, et que donc en prenant une correction mécaniquement on apprend. Il est difficile de passer du temps avec chaque élève pour lui apprendre à analyser ses erreurs, pour éviter qu’il la reproduise.
Il faudrait leur apprendre à porter un jugement critique, à différencier une notion mal comprise, d’une étourderie, d’une confusion d’énoncé, … Il y a tout un travail à mettre en place pour que le temps passé en classe soit productif et non scolaire.
Lors de corrections d’exercices, nombre d’élèves en difficultés effacent leurs erreurs, préférant recopier du juste. En classe, je rencontre régulièrement des élèves qui bloquent pour démarrer dans des exercices, de peur de commencer faux, de faire des erreurs, d’avoir à effacer. « Je préfère avoir du juste sur mon cahier et donc attendre la correction monsieur. Je comprends mieux » revient régulièrement. L’illusion que copier du juste laisse entendre que se tromper, c’est mal.
Il n’y a pas que l’évaluation qui est responsable de cette situation. Mais la pression contre la faute, vécue comme un échec, et sanctionnée lors des évaluations, pousse à ces comportements au quotidien qui freinent les apprentissages.
Ces élèves en difficultés, qui recopient du juste en croyant avoir compris, se rendent compte lors de l’évaluation de l’écart qui existe entre lire du juste et le produire. On se heurte à des élèves qui passent du temps à travailler mais inutilement, inefficacement.
Il faut apprendre à apprendre, et nous le faisons collectivement assez mal.
L’évaluation par compétences est un outil qui va dans cette direction. Les remédiations sont de ce point de vue, une révolution culturelle. L’évaluation est vécue par les élèves comme une étape d’apprentissage, qui permet de se positionner et de pointer ses difficultés avant de les retravailler pour progresser. On aide l’élève à juger de ses méthodes de travail, à les analyser, sans le pénaliser.

Le bilan à donner sur le bulletin

La situation idéale est évidemment de travailler en équipe, pour adapter ce mode d’évaluation collectivement. Dans cette situation, on peut alors dépasser la moyenne chiffrée sur le bulletin, pour présenter un autre bilan des élèves. On pointe alors le nombre d’items acquis, partiellement acquis ou non acquis par matières.
Dans des pratiques plus individuelles, il est nécessaire pour rester en phase avec le reste de l’équipe de sortir une moyenne sur 20. Le logiciel SACoche, très souple et paramétrable, propose une moyenne pondérée des scores d’acquisition qui, ramené sur 20 aboutit à une moyenne classique.
Cette moyenne, même si elle porte en elle une partie des tares des notes et moyennes sur 20, possède toutefois deux gros avantages.
Elle est issue d’un algorithme de calcul clair et bien en place dès le début de l’année, ce qui confère un caractère objectif à ce bilan, la note moyenne étant une résultante directe des résultats. Elle n’est pas affectée par les travers de la notation classique pointés plus haut.
Enfin, comme expliqué plus haut, l’élève devient acteur de sa moyenne, puisqu’il peut intervenir dessus avec les remédiations. L’élève n’est plus passif face à son échec mais il a les clés pour reprendre les notions mal comprises, se faire réévaluer. La culture de la note encore bien présente même quand on évalue par compétences permet de l’utiliser intelligemment, non pour sanctionner mais pour stimuler l’élève.

– Les retours des parents et des élèves

Les élèves

Les élèves sont perturbés au départ par l’absence de repère global. On voit des élèves essayer de reconstituer des notes à partir des bilans, pour se comparer aux autres, pour se remettre dans le cadre rassurant de la note sur 20, même si le nombre qu’ils ressortent de leur calcul, n’a aucun sens et sera sans lien avec le bilan qu’ils auront en fin de trimestre.
Il faut un long travail de persuasion pour progressivement faire accepter aux élèves cette révolution culturelle. Mais au final, cela fonctionne assez bien.
Je propose des petites vidéos d’élèves de seconde avec qui j’ai mis en place ce mode d’évaluation l’année 2013/2014. Bien sûr cet échantillon n’a aucune valeur statistique. J’ai filmé les élèves qui acceptaient de parler devant une caméra, sans couper ni censurer. Ils n’avaient pas été prévenu et n’avaient donc rien préparé. Le propos est court mais intéressants.
Cela donne une idée réaliste du retour qu’on obtient.

Les vidéos d’élèves

Frédérique, qui a vécu à l’étranger, pose un regard comparatif sur l’évaluation en France :

Anaïs, sceptique au départ, explique pourquoi elle a adhéré :

Eline vante l’intérêt pour les élèves en difficultés :

Mathias pointe l’aspect sanction des mauvaises notes :

Dorian apprécie le droit à l’erreur

Chloé trouve cela « débile ». Pourquoi ?

Sarah apprécie qu’on se détache des notes

Sabri trouve « révolutionnaire » les remédiations

Et les parents ?

Il y a autant de réponses et de retours possibles que d’expériences menées. J’ai lancé une petite enquête l’an passé et je joins les retours écrits des parents, pour illustrer l’état d’esprit que j’ai rencontré, alors que j’étais arrivé en janvier dans cet établissement, en remplacement d’un collègue qui notait traditionnellement et que j’étais le seul enseignant à travailler ainsi.
Ces remarques n’ont aucune valeur de sondage. Ce ne sont que des témoignages de parents concernés.
Je propose ici l’intégralité des commentaires reçus lors de l’enquête que j’ai menée à la fin de l’année. Elles vont toutes dans le même sens, ce qui ne signifie pas que l’ensemble des parents étaient sur la même longueur d’onde.
Cela laisse penser que ceux qui réagissent le plus sont ceux qui sont acquis. Ce qui est un facteur de réussite.
Si je crois qu’il est utile de placer ces remarques ici, c’est pour tenter de rassurer les collègues qui pensent que les parents seront un obstacle à cette pratique.

– Les retours négatifs formulés par des collègues

Discussions sur le sujet

Au cours de mes nombreuses discussions sur le sujet, de façon informelle avec des collègues ou au cours de petites formations internes aux établissements, j’ai relevé certains blocages récurrents. Je propose de les aborder rapidement.

Pas facile de changer de pratique

Beaucoup de collègues exercent leur travail avec professionnalisme et sérieux depuis des années, tout en notant sur 20, ce qui n’est évidemment pas contradictoire. Légitimement, ils sont confrontés à une crainte devant l’idée de changer radicalement l’approche de l’évaluation. C’est en effet une prise de risque de modifier son système d’évaluation, une certaine mise en danger, qui bouleverse des années de pratique.
Il n’est pas facile de franchir cette étape seul, de découvrir les problématiques liées à cette nouvelle manière d’évaluer au fur et à mesure qu’on avance dans la mise en place. Il est donc évidemment plus aisé de travailelr collectivement autour d’un tel projet, de partager ses expériences et d’être accompagné par un collègue qui a de l’expérience.
Mais SACoche est un logiciel qui mise sur le collaboratif. Outre des tutoriels vidéos et des notices pour chaque paramétrage, il existe un forum dédié, où chacun peut poser ses questions, une liste de diffusion des administrateurs permet d’épauler les responsables des installations. Enfin, le logiciel permet une mise en commun des référentiels et des remédiations proposées par matières. Une sorte de pot commun dans lequel les équipes placent leur référentiel, leurs liens vers des aides individualisées et ciblées, si elles le jugent utile. Cela constitue une base importante et une aide pour qui veut se lancer et profiter des expériences des autres.
Au final, même en partant seul, ce qui fût ma démarche initiale, il est facile, avec un peu de détermination, de mettre en place cette pratique.
Je ne peut qu’inciter des collègues hésitants à franchir le pas.

Une pratique chronophage ?

Une crainte souvent entendue est l’idée que cela prend bien plus de temps de travailler ainsi. Au final, une fois installé dans cette pratique, je ne le pense pas.
Il est évident qu’au départ, il faut découvrir les facettes de l’évaluation par compétences, les décliner dans sa matière avec sa personnalité et ses objectifs. La phase de tâtonnement peut sembler une perte de temps, mais comme toute mise en pratique nouvelle, une fois bien rodée, elle fonctionne très bien.
Il ne faut plus rentrer une note sur le logiciel mais cinq ou dix items sur SACoche. Mais nous ne perdons plus de temps dans les barèmes, ni à compter les points sur les copies. Au final, l’effort à fournir pour mettre en place ses nouvelles stratégies de travail est vite apprécié, tant la nature du métier change.

L’évaluation n’est pas tout. Il ne faut pas oublier la pédagogie !

Bien sûr qu’en amont de l’évaluation, il y a les stratégies d’apprentissages à revoir. Pour cet aspect, on déborde du sujet de l’article. Mais il est cohérent de réfléchir à une pédagogie coopérative par exemple, ou différenciée, quand on évalue par compétences.
L’idée qui est importante avec l’approche par compétences de l’évaluation est qu’elle s’inscrit dans le processus d’apprentissage, qu’elle est dynamique et entre les mains de l’élève. Ces aspects sont déjà des points importants de pédagogie valorisés par les compétences.

Une idée dangereuse ?

Une idée entendue par des milieux syndiqués, militants de gauche, voire d’extrême gauche, serait que l’évaluation par compétences est dangereuse car elle favoriserait l’interdisciplinarité. Que le collègue d’histoire géographie peut évaluer les compétences de français par exemple. Et la crainte serait, que derrière de nobles intentions, se cachent des volontés gouvernementales, de casser l’école publique, de forcer les enseignants à enseigner deux matières, de supprimer le bac et le DNB pour se limiter à un contrôle continu (validés par les compétences, le socle, ...).
A force d’avoir peur du loup, on le voit partout. Et on bloque toute évolution d’une école pourtant en inadéquation totale avec ses objectifs.
La pratique que je défends n’émane pas des consignes ministérielles. Elle vient de la base des enseignants, qui se sont organisés eux-mêmes avec ce logiciel formidable qu’est SACoche, élaboré par Thomas Crespin, soutenu par l’association Sésamath, en toute indépendance du pouvoir.
Défendre l’évaluation par compétences, ce n’est pas faire allégeance à la hiérarchie, c’est se battre pour une pratique en cohérence avec ses valeurs. Et cela n’empêche nullement chacun, en toute liberté, de dénoncer s’il le souhaite, tel ou tel projet gouvernemental.

– Conclusion

Je pense qu’il y a peu à attendre des grandes déclarations actuelles sur l’évaluation. Comme dans beaucoup de domaines, ce sont les acteurs sur le terrain qui font évoluer les choses bien plus que les orientations données par la hiérarchie.
En discutant, en confrontant les pratiques, on arrive à convaincre qu’une autre approche est possible. A faire effet boule de neige.
C’est mon quotidien depuis 5 ans et cet article a cet objectif.
Le logiciel SACoche est indissociable d’une évaluation par compétences professionnelle, rigoureuse et non chronophage. Il apporte une sérénité dans la mise en place tant il est fonctionnel et reconnu.
J’encourage donc vivement les collègues hésitants à se lancer dans l’aventure. Si jamais cet article donne envie à certains tenter l’expérience, alors j’aurai atteint mon objectif.