PLAN
DU SITE
|
La
Docimologie
ou
la notation aux examens
Les
expériences existent depuis bien longtemps, mais
tout se passe comme si elles n'avaient jamais eu lieu.
Soit on ne
les connaît pas, soit on n'y "croit pas"
! (Voir: Biblographie
sur la docimologie)
|
|
|
Second
ou avant dernier ? Admis à l'agrégation ou
éliminé ?
En
1930
le professeur Laugier sème un malaise pernicieux dans
les milieux universitaires, en effectuant une expérience
de multicorrection de copies d'agrégation d'histoire
puisées dans les archives. 166 copies ont été
corrigées par 2 professeurs travaillant séparément,
sans connaître leurs appréciations
respectives.Tous les deux avaient une longue expérience
et corrigeaient méticuleusement. Les résultats
furent surprenants. La moyenne des notes du premier
correcteur dépassait de près de deux points
celle du second. Le candidat classé avant dernier par
l'un était classé second par l'autre. Les
écarts de notes allaient jusqu'à 9 points. Le
premier correcteur donnait un 5 à 21 copies cotées
entre 2 et 14 par le second ; le second donnait un 7 à
20 copies cotées entre 2 et 11,5 par le premier. La
moitié des candidats reçus par un correcteur
était refusée par l'autre.
Cette
expérience caractéristique de docimologie
a amené des chercheurs de plus en plus nombreux à
s'interroger sur les sources d'erreurs des procédures
d'évaluation traditionnelles.
|
DIFFÉRENTS
TYPES D'ERREURS
F.
Bacher (1969) distingue trois sources d'erreurs.
1°)
"La première source d'erreurs est due à
l'évaluateur
lui-même qui
note autour d'une
moyenne plus ou moins élevée
et qui disperse
plus ou moins ses notes autour de cette moyenne.
De
plus les évaluateurs ne classent pas dans le même
ordre une même série de travaux ou de
réponses.
2°)
La seconde source d'erreurs tient, dans les examens
traditionnels, au
choix du sujet même de
l'examen. Il est en effet peu satisfaisant de
généraliser à l'ensemble des
candidats une constatation "ponctuelle",
fondée sur l'un seulement des innombrables sujets
qui auraient pu lui être proposés.
3°)
La
troisième source d'erreurs vient des
élèves.
D'un jour à l'autre, d'un moment à
l'autre, se produisent des fluctuations aléatoires
de la capacité qu'il s'agit d'évaluer. De
plus une certaine forme d'évaluation peut
défavoriser de façon systématique
un type d'élèves (la question s'est posée
notamment à propos des épreuves
orales)"(Reuchlin, 1.67 p. 215)
|
PREMIÈRE
SOURCE D'ERREURS : L'EVALUATEUR
Les
évaluateurs ne sont pas d'accord entre eux.
-
* En
1932 eut
lieu une des premières enquêtes docimologiques.
La Commission Carnégie
effectua
une expérience de multicorrection en prélevant,
au hasard, cent copies dans les archives du baccalauréat
à Paris. Ces copies furent distribuées à
6 groupes de 5 examinateurs. Les disciplines concernées
étaient : le français, la philosophie, le
latin, les mathématiques et la physique. On demanda
aux examinateurs de noter les copies et de fournir un
rapport sur
-
les qualités exigées
-
le classement des dites copies - la méthode de
notation utilisée.
Les
résultats montrèrent une forte dispersion des
notes attribuées à chaque copie par les
correcteurs. Aucune copie ne reçut deux fois la même
note. L'écart maximum des notes dépassa les
prévisions.
Une
copie de fran çais est notée 3 et 16 ; en
philosophie et en latin l'écart maximum est de 12
points.
Les
mathématiques et la physique, réputées
pour des sciences exactes, ne sont pas épargnées
: l'écart
maximum est respectivement de 9 et 8 points.
D'autre
part, le
classement des copies variait fortement d'un correcteur à
l'autre.
-
* En 1975 l'Institut de
Recherche sur l'Enseignement des Mathématiques de
Grenoble entreprend
une expérience analogue de multicorrection.
Un
échantillon de 6 copies photocopiées de
mathématiques (niveau B.E.P.C.) est soumis à
64 correcteurs, avec
un barème,
très précis, sur
40 points.
Les
résultats confirment ceux de l'enquête
précédente, effectuée 43 ans plus tôt.
La
dispersion des notes atteint près de 20 points.
-
* Le Centre
International d'Études Pédagogiques de Sèvres,
l'Association des Professeurs de Français, le Centre
Pédagogique Régional de Toulouse, l'I.R.E.M.
de Toulouse,
pour ne citer que les plus marquants ont mené des
expériences du même type et sont arrivés
aux mêmes
conclusions.
De
plus, Laugier et Weinberg ont montré que la
double correction est illusoire.
En effet il faudrait, pour obtenir une note "exacte"
(Une note "exacte" étant une moyenne de
notes telle que l'adjonction d'une autre note ne modifie
pas sensiblement cette moyenne) .- 127 correcteurs en
philosophie - 78 " en composition française
- 28 en anglais - 19 en version latine - 16 en physique
- 13 en mathématiques
|
Les
divergences entre correcteurs ne sont pas seules en cause
En
plus l'évaluateur n'est pas d'accord avec lui-même
Pas d'accord entre eux, les
examinateurs ne se montrent pas davantage fidèles à
eux-mêmes lorsqu'il s'agit de juger une seconde fois
un devoir après un intervalle plus ou moins prolongé.
Les
enquêteurs anglais
en
avaient été frappés. Laugier et
Weinberg en France,
avaient fait la même constatation. A leur demande
un professeur de physiologie de la Faculté des
Sciences accepta 37 copies -dactylographiées et
anonymes - qu'il avait corrigées trois ans et
demi auparavant.
Dans
7 cas seulement, il remit la même note au même
devoir. Dans les 30 autres cas, il y eut des divergences
comprises entre 1
et 10 points.
L'admissibilité,
avec ses nouvelles notations, aurait été
modifiée
; la moitié des précédents
admissibles aurait été refusée et
la moitié des refusés déclarée
admissible.
Le
degré d'accord de ce professeur avec lui-même
ne fut pas plus élevé qu'avec deux de ses
collègues chargés de la même tâche
: les coefficients de corrélation atteignant
respectivement 0,58, 0,59 et 0,56.
|
On
poursuivit plus loin l'expérience, et elle aboutit à
un fait plus troublant encore.
On
demanda à
une bachelière,
Paulette, intelligente mais ignorant
tout de la question traitée,
de noter à son tour ces compositions de
physiologie, après les avoir lues une fois pour
se faire une idée du sujet. Ses notes eurent une
corrélation de 0,51 avec celles attribuées
par les professeurs compétents. La
bachelière ne se trouvait pas plus en désaccord
avec les spécialistes que ceux-ci entre eux".
(in Science et Vie, 1968, n° 610).
|
Avec
des enseignants de l'I.R.E.M. de Reims,
j'ai fait corriger 20 copies de B.E.P.C. par 30
professeurs de mathématiques après
l'établissement d'un barème. J'ai corrigé
aussi ces copies sans
les lire,
en regardant l'écriture et la présentation.
Le maximum de l'écart pour une même copie
était de 11 points sur 20. Ma note n'était
jamais à une extrémité!
Cette
expérience a provoqué un choc affectif
considérable chez les enseignants participants:
"Si c'est comme cela, je n'ai plus qu'a donner ma
démission d'enseignant". Il ne s'agissait
plus seulement d'information mais de connaissance
(cognito-émotionnelle). Cette expérience
pourrait être faite avec profit dans les I.U.F.M.
|
"
"Prenons le cas d'un correcteur en face
d'une copie anonyme d'examen. Il se forme dans la
conscience du correcteur l'image d'un couple affectif ;
il est là devant l'élève qu'il ne
connaît pas mais qu'il essaie de voir à
travers l'image d'un cancre ou d'un élève
intelligent, ou d'un imbécile, ou d'un
original... C'est en fonction de l'harmonie ou du
désaccord de ce couple affectif que le correcteur
va le plus souvent noter.
En
corrigeant, il se forme d'une façon plus ou moins
distincte une image d'élève sur laquelle
il applique progressivement une étiquette type en
fonction de sa répugnance ou de son admiration
pour lesquelles peu de chose suffit, une jolie phrase,
une de ses idées favorites qu'il retrouve
exprimée, ou un cliché qui lui déplaît.
On
constate des différences très grandes... à
l'occasion de la même copie corrigée une
deuxième fois à quelques jours
d'intervalle, la première note ayant été
effacée. Dans ce dernier cas, selon l'humeur du
moment, la lecture de la veille, les soucis du jour ,
l'amabilité, la gentillesse ou l'insolence dont
ont pu faire preuve les élèves dans la
classe du jour précédent, les réactions
sentimentales du correcteur ne sont pas toujours les
mêmes et un nouveau couple affectif apparaît
dans sa conscience, un couple dont les deux partenaires
se sont trouvés changés."
(M.
Marchand, Le couple de l'éducateur et de l'élève
dans leurs relations concrètes. Université
d'Alger
|
Les
évaluateurs sont influencés par des facteurs
qu'ils ne soupçonnent même pas
Plus
significatives encore sont les expériences de R.
Rosenthal.
"Les
expérimentateurs devaient étudier le
comportement de rats
et les noter, au cours d'un programme comprenant des
techniques classiques (apprentissage du labyrinthe et
boite de Skinner). Il fut dit à la moitié
des expérimentateurs que les rats qu'ils devaient
étudier avaient été spécialement
choisis pour se comporter brillamment, à l'autre
que les rats avaient été spécialement
choisis pour être stupides et bien entendu, les
rats avaient été choisis au hasard. Dans
les deux études de ce type réalisées
par Rosenthal les expérimentateurs croyant leurs
sujets brillants obtinrent un bien meilleur
apprentissage de leurs rats que ceux qui pensaient que
leurs sujets avaient été choisis pour être
stupides".
Rosenthal
est allé encore plus loin en reproduisant une
situation réelle de l'enseignement.
"Dans
18 classes d'une école primaire américaine,
20 % des élèves choisis rigoureusement au
hasard, furent signalés à leurs
professeurs comme ayant eu des résultats
particulièrement brillants à un test non
verbal d'intelligence générale, permettant
prétendument de prédire leur
épanouissement intellectuel. Les enfants ne
savaient rien, seuls les professeurs étaient au
courant. Au bout d'une année, ces enfants avaient
réellement un gain de quotient intellectuel
franchement supérieur, en moyenne, à ceux
du groupe de contrôle". (in Atome n° 242
article de H. Pequinot,).
Citons
les
travaux de C. Chase
qui ont mis en évidence l'influence de la qualité
de l'écriture sur les notes attribuées aux
rédactions (The impact of some obvious variables,
in journalof Educational Measurement, 1968) et ceux de
Wilson qui ont montré que les enfants des zones
géographiquement défavorisées sont
cotés au plus bas, par le fait même qu'ils
appartiennent à ces zones.
|
L'évaluation
est fortement teintée par la personnalité
de l'évaluateur.
L'enseignant
s'évalue autant qu'il évalue ses élèves!
|
DEUXIÈME
SOURCE D'ERREURS : LE SUJET
Le choix même du sujet
d'un contrôle ou d'un examen, les conditions de
passation, interviennent également dans une large
mesure. Des éléments, choisis pour éviter
toute variation intempestive, tels que barèmes et
coefficients de pondération sont loin de remplir les
conditions de fiabilité souhaitées.
Le
barème
La
plus grande partie des épreuves d'un examen fait
intervenir un barème plus ou moins précis
selon la matière. Ce barème a pour but
d'uniformiser la codification des appréciations.
Mais ce barème que les correcteurs sont "priés
de respecter scrupuleusement" est-il un instrument
fiable ? Plusieurs équipes de chercheurs se sont
penchés sur ce problème.
L'I.
R. E. M. de Rennes a fait corriger 22 copies
de
mathématiques (c'est l'épreuve de
mathématiques, où le barème a une
place fondamentale, qui a le plus souvent été
testée) du B.E.P.C. par 10 professeurs. Cinq
d'entre eux l'ont fait avec barème, les autres
sans barème. L'analyse des résultats a
mis en évidence trois points
-
les utilisateurs du barème ont corrigé
plus sévèrement
-
l'écart entre les notes extrêmes est
moindre quand on tient compte du barème
-
le barème ne supprime pas la dispersion des
notes.
Devant
la déception de voir le barème se limiter
à un rôle vaguement modérateur, on a
été amené à l'affiner, dans
l'espoir d'obtenir une meilleure précision dans
l'évaluation.
Le
Groupe de Recherche de Montauban dirigé par
Cransac et Dauvisis
s'est penché sur ce problème en 1975. Il
leur a fallu plus de15 heures de travail pour se mettre
d'accord et élaborer un barème très
précis (sur 120 points). Malgré cet
effort" pour une copie dont la note varie de 4 à
13 sur 20, chaque correcteur concerné a justifié
sa notation et il a été impossible de
donner raison à l'un ou à l'autre.
Certains ont donné tour à tour raison à
l'un puis à l'autre". D'autre part, le
barème devient illusoire quand dans "une
réponse peu claire, l'un voit un bon
raisonnement, l'autre un raisonnement faux ; ce qui est
inquiétant"
"le
barème imposé est appliqué en
fonction de la personnalité des correcteurs.
Certains
l'appliquent à la lettre en faisant fi de leurs
sentiments et de leur expérience pédagogique,
d'autres ne peuvent ou ne veulent le faire et modulent
le dit barème." (Ronceray, De l'influence du
barème, I.R.E.M. Rennes)
.
Nouvelle déception. L'I.R.E.M. de
Strasbourg reprend cette expérience. On
raffine le barème. On demande aux correcteurs "un
travail d'appréciation de l'écart des
copies en les confrontant deux à deux afin
d'améliorer leur évaluation." Le
groupe de recherche espère ainsi "faire des
observations des copies deux à deux".
Résultats : la fiabilité de la correction
n'est pas améliorée. Sans se décourager
on fait une "tentative de codage des comportements
de réponse" avec "détermination
d'un barème associé à ce codage".
Là encore c'est l'échec. Mais ces travaux
remarquables amènent les chercheurs vers une
autre direction : l'analyse plus soigneuse des sujets
proposés.
|
Le
choix du sujet
La
présentation et la formulation du sujet d'une
épreuve peuvent-être source d'erreurs et la
note d'un candidat ne pas refléter sa valeur
propre. En effet, peut-on évaluer sérieusement
les qualités d'un élève qui n'a pas
su faire un problème dont les questions sont
dépendantes et la première piégée
? Peut-on évaluer sérieusement les
qualités d'un élève qui disserte
"hors sujet" quand, au cours d'une expérience
de multicorrection, une copie de français a été
annotée "sujet bien traité" par
un correcteur et "sujet non traité" par
un autre correcteur ?
La
formulation d'une question portant sur un concept
mathématique donné détermine
souvent l'exactitude de la réponse, tout comme,
selon Piaget, la façon de poser une question
orale à un candidat influence la réponse
de ce candidat.
On
retrouve dans ces études sur le barème
l'évaluateur
Le
Groupe de Recherche d'Epernay de l'I.R.E.M. de Reims a
effectué une enquête sur ce thème en
1975. Il a mis en évidence la variabilité
de l'exactitude des réponses selon les différents
items d'un concept donné.
Citons
un exemple frappant : le concept de l'équation.
A
la question :"On achète deux pains, on donne
dix francs, la marchande rend une pièce de cinq
francs et une de un franc ; quel est le prix d'un pain
?, on obtient 93,44 % de réponses exactes dans
une population d'élèves de troisième.
A
la question :"Résoudre dans R: 2x+6=10",
le pourcentage de réponses exactes tombe à
81,49 %.
Enfin
si la question prend la forme suivante "Résoudre
dans R : 2000x+6000=10000." on n'obtient plus que
60,34 % de bonnes réponses.
Il
suffit donc de multiplier des données numériques
2, 6, 10 par 1000 pour que un quart des élèves
ayant bien répondu à la question
précédente se trompe à la dernière.
Les résultats de cette enquête incitent "à
la prudence dans le choix des critères qui
permettent de déterminer le degré
d'acquisition et de compréhension d'un concept
mathématique. On peut également se
demander si la compréhension d'un cours ne dépend
pas étroitement de sa formulation.
|
Enfin
on peut s'interroger sur le désir inconscient
d'échec ou de succès du professeur
vis-à-vis de ses élèves.
La
notation n'en est -il pas en partie le reflet?
C'est une question que je
me suis souvent posée en tant que Président
de jury de bac.
|
TROISIÈME
SOURCE D'ERREUR : L'ÉVALUÉ
Une cause non négligeable
de fluctuation réside dans deux facteurs difficiles à
maîtriser et à estimer : la variabilité
des candidats et des conditions extérieures lors du
déroulement des opérations.
"La
réaction affective de chaque élève
à la situation diffère selon sa stabilité
émotionnelle du moment,
son état de santé, la pression familiale ;
en outre, du fait du temps limité, un incident
mineur, même le bris d'une pointe de crayon,
constitue un handicap inaperçu par le professeur.
Dans des épreuves comme la dictée, la
place occupée dans la salle peut fausser les
résultats. De tels facteurs d'irrégularité
sont spécialement actifs au cours des périodes
de rapide évolution physique ou intellectuelle ;
en particulier, plusieurs auteurs les ont mis en
évidence au moment de la puberté".
(Hotyat, in Revue Française de Pédagogie,
Janvier 1968)
"Ce
qui frappe aussitôt, c'est l'extrême
variété et complexité des réactions
individuelles des élèves confrontés
aux épreuves
et aux estimations qu'en font les maîtres. Il
apparaît alors à l'évidence que
l'examen, voire la simple composition de contrôle,
sont d'abord des "événements" à
caractère historique, qui s'inscrivent dans le
destin personnel de l'élève, dont il est
difficile de les dissocier. Qu'on pense à tel
enfant de sixième pour qui chaque épreuve
scolaire marque l'heure d'une nouvelle et solennelle
remise en question de son statut à l'égard
du professeur, et plus encore de ses parents, tandis que
tel autre, au même âge et dans la même
classe, vit les examens comme une ennuyeuse corvée,
dont il faut se tirer économiquement pour
conserver le minimum de quiétude indispensable à
la survie en milieu d'école. Qu'on pense à
la panique de quelques uns devant le baccalauréat,
à l'excitation conquérante de quelques
autres, à la conduite soumise et humblement
séductrice d'un certain nombre, au fatalisme de
ceux-ci, à l'ingéniosité défensive,
parfois malhonnête, de ceux-là, et ainsi de
suite. Il est clair que ces conduites pèsent
lourdement sur le résultat final de l'examen
écrit ou oral, même si l'on admet, par
impossible, que le maître demeure, pour sa part, à
l'abri de toute variation ou inconsistance dans
l'appréciation qu'il porte. Si l'on considère
alors que de tels effets ne sont intelligibles qu'en
référence à la personnalité
de l'élève, et que cette personnalité
ne se comprend à son tour qu'en fonction d'un
contexte socio-familial et d'un devenir d'ensemble qui
lui est rigoureusement propre, on admettra qu'il y a de
quoi inquiéter un esprit soucieux de "justice"
et rendre quelque peu suspectes les tentatives de
réduction statistique concernant la notation,
encore que les règlements rendent obligatoires
classements et notations. A la limite en effet, il n'y a
plus, en cette voie que des cas rigoureusement
individuels, et donc incomparables". (Guillaumin,
Docimologie et éducation, Les sciences de
l'éducation, avril-septembre 1969).
"Lors
d'un
sondage belge sur
le travail après la classe, la question suivante
avait été posée à des élèves
de 6°, 4°, 3°, 1° d'enseignement moyen
et de dernière année d'école
normale (2031 sujets). "Lors d'un examen ou d'une
interrogation écrite, devenez-vous nerveux au
point de ne pas obtenir des résultats
correspondant à vos moyens et à vos
efforts ?" Trois degrés étaient
prévus pour les réponses : rarement,
souvent, presque toujours. Plus de la moitié des
interrogés signalaient ressentir souvent ou
presque toujours un tel handicap. Contrairement à
ce que l'on avait pu attendre, les fréquences
étaient à
peu près égales chez les garçons
(54,2 %) et chez les filles (54,6 %) apparemment plus
émotives. En revanche, les élèves
étant répartis en trois groupes selon
leurs résultats dans leur classe, les fréquences
étaient respectivement les suivantes
38,2
% dans le tiers supérieur, 59,3 % dans le
deuxième tiers et 67,5 % dans le tiers inférieur.
Cependant,
des
difficultés ont rarement un caractère
pathologique
: en Grande Bretagne, un relevé des cas soumis
aux Child Guidance Clinics, entrepris dans une aire
géographique couvrant 212000 écoliers de 5
à 16 ans, révéla que sur 5 705
sujets ayant eu besoin de consultations des services
d'hygiène mentale, le psychologue ou le
psychiatre avaient signalé les examens comme
facteurs de trouble dans 41 cas seulement".
(Hotyat, Revue Française de Pédagogie,
Janvier 1968).
|
En
résumé la note n'est pas mesure mais
message, avec toute l'ambiguïté de tous les
messages!
|
La prise de conscience de
la "complexité" de l'évaluation
doit amener à relativiser les résultats et
à introduire une souplesse dans ses conséquences,
en particulier dans l'orientation.
Deux dimensions sont à
prendre en compte, nous semble-t-il, pour apporter cette
souplesse:
-
le
temps: le
contrôle continu nous paraît préférable
à une évaluation instantanée,
couperet. (Le Bac Pro actuel en est un exemple)
- l'ouverture:
les examens par cumuls de modules , de crédits
(l'européanisation des diplômes va dans ce
sens) sont favorables dans la mesure où ils
laissent "ouverte" la possibilité, avec
le temps, de compléter et de revoir l'orientation
tout au long de la vie.
|
Pour
approfondir
Biblographie
sur la docimologie
Conférence
de André Antibi à l'ESEN sur la constante
macabre
|
Un
texte de Philippe Watrelot
<<
La question des notes est un débat intéressant
et clivant dans l’opinion publique. Et cela illustre
assez bien les tensions qui traversent l’école.
Si les notes ont été inventées, ne
l’oublions pas, c’est d’abord pour classer
et trier. Quand Jules Ferry promulgue un décret le 5
juin 1890 qui stipule que “dans les compositions,
chaque copie aura sa note chiffrée de 0 à 20”,
c’est sous la pression des grandes écoles et
des concours administratifs. Comme le souligne l’historien
de l’éducation Claude Lelièvre “le
classement précède la note” . La France
est depuis cette époque un pays de concours et la
note est d’abord l’outil de cette sélection.
C’est, d’une certaine manière, inscrit
dans le code génétique de la société
française. L’évaluation est d’abord
définie en France comme une évaluation
normative où l’on se compare aux autres (ce qui
n’est pas vrai dans d’autres pays). Mais cette
conception est productrice d’échec et de perte
d’estime de soi. Elle est aussi néfaste pour
les apprentissages puisqu’elle transforme l’erreur
en faute et conçoit l’évaluation comme
une fin et non une partie du processus. Il ne s’agit
pas de dire que cette conception de l’évaluation
doit être abandonnée. Qu’on le veuille ou
non, à un moment l’École sélectionne.
Mais on peut faire en sorte que cela se fasse le plus tard
possible. Et l’enjeu est alors de développer
avant une autre conception de l’éducation qui
soit une évaluation au service des apprentissages. Où
il ne s’agit pas forcément de se comparer aux
autres mais de mesurer ses propres progrès par
rapport à des critères et des objectifs
d’apprentissage.
La
remise en cause des notes est en fait un débat majeur
qui touche aux valeurs mêmes de notre société.
Une société fondée sur la sélection
et les inégalités plutôt qu’une
société bienveillante et égalitaire. Un
autre enjeu réside dans la nécessité
pour les évaluations alternatives à être
aussi “lisibles” que les notes le sont en
apparence. Car, on peut déjà rappeler que les
notes sont loin d’être fiables. Les travaux de
la docimologie (l’étude des biais de la
notation) l’ont montré depuis les années
30. Mais, alors que cela devrait faire partie de leurs
connaissances de base, ces travaux sont très peu
connus et peu diffusés dans la formation des
enseignants. Face aux notes, pour l’instant,
l’évaluation par compétences a souvent
pris la forme de “grilles” relativement
complexes et peu lisibles pour les parents et les élèves.
Les enseignants qui innovent dans ce domaine doivent
poursuivre leurs efforts de communication dans ce sens. Pour
éviter les usines à cases et évaluer
sans fausses notes.>> Revue
de presse 3/09/12
|
Réactions
<<
C’est bien beau les commentaires de la docimologie qui
est d’ailleurs une science de mesures qui permet aux
apprenants de voir comment ils évoluent dans les
matières et dans toutes matières enseignées.>>
<<Cet
article est plus que nécessaire car il faut que tous
ceux qui tiennent le bic rouge pour noter savent qu’ils
tiennent également en main la vie des enfants. >>
<<je
trouve cet article intéressant. je pense que les
écarts existent vraiment surtout dans les
dissertations les commentaires... il arrive rarement que
deux correcteurs donnent une même note. je pense que
c’est a cause de la subjectivité>>
<<Bonjour,
Je trouve ce document très intéressant Je
voulais savoir si une expérience consistant à
retranscrire des copies sur l’ordinateur (afin
déliminer les paramètres d’écriture
et de présentation )avait été réalisée
, le document manuscrit disparaissant de plus en plus dans
l’espace professionnel, cela ne pourrait il pas
permettre de mieux identifier les compétences
spécifiques et les richesses d’un candidat
donné,sans que cette identification ne soit brouillée
par d’autres paramètres qui deviendront, en
pratique, dès l’entrée dans le poste,
non pertinents>>
<<Dans
le pays congolais(kin) ns avons encore le probleme de
l’évaluation qui provient de la non
qualification et de la malformation. Normalement
l’évaluateur devrait être celui qui
connaît bien la construction de test...le gouvernement
congolais reste encore avec un grand probleme à
gérer. Il n’y a personne qui n’ignore un
taux élevé d’analphabétisme tant
classique que fonctionnel en RD CONGO. Tout cela pourrait
influencer le développement du pays.>>
<<L’enseignement
au congo Brazzaville est un pheneomene social qui constitue
un grand handicap.les enseignant qui ont pour mission de
dispenser les enseignements et aussi le savoir ne sont plus
ceux qu’ils etaients hier ,nous sommes conscients de
faire attention nous enseignants ,detruire un enseignant
c’est dtruire une ou des generations>>
<<C’est
bien même très bien de faire constater cela aux
enseignants mais comment faire pour contester une note ? Le
jury est souverain? >>
<<J’avoue
que vous avez fait un développement impressionnant
sur la docimologie et vos analyses ont le mérite de
mettre en lumière tout évaluateur
conscient.Une question tout de même: Quel est l’impact
de l’évaluation sommative sur la psychologie de
l’apprenant? >>
<<La
prise de conscience de la "complexité" de
l’évaluation doit amener à relativiser
les résultats et à introduire une souplesse
dans ses conséquences, en particulier dans
l’orientation. Deux dimensions sont à prendre
en compte, nous semble-t-il, pour apporter cette souplesse:
- le temps: le contrôle continu nous paraît
préférable à une évaluation
instantanée, couperet. (Le Bac Pro actuel en est un
exemple). - l’ouverture: les examens par cumuls de
modules , de crédits (l’européanisation
des diplômes va dans ce sens) sont favorables dans la
mesure où ils laissent "ouverte" la
possibilité, avec le temps, de compléter et de
revoir l’orientation tout au long de la vie.>>
Nokia Middle East
<<Merci
pour ce travail. Pour ma part, ce qui m'interesse le plus
serait de trouver des ressources et des conseils sur une
conception optimale d'évaluations. La docimologie
s'intéresse-t-elle aussi à cet aspect ?>>
<<Merci
pour cet article, comme vous dites, "ça fait 100
ans qu'on sait tout ça et qu'on n'en tient pas
compte!" Ne pensez-vous pas que notre société
industrielle et "anomique" comme dirait l'autre,
ayant perdu ses repères ancestraux (et je ne m'en
plains pas, église, travail, famille, patrie... et
touti quanti)est aujourd'hui plus que jamais à la
recherche de critères de valeur, d'échelles et
de jugements en tous genres. Pour se comparer, se rassurer,
critiquer, jauger... à n'en plus finir. Avez-vous vu
ces émissions pathétiques sur la 6 ou des
personnes s'invitent à diner, ou tout le monde est
bien cordial et sympathique, pour finir, à la sortie,
en notant le repas et l'accueil ? ou ces autres émissions,
encore plus pathétiques, ou des bonnes femmes au look
d'un autre temps viennent vous apprendre à faire le
ménage chez vous ou à élever vos
enfants ? Pour moi, cela relève du même besoin
: établir des normes, fictives mais rassurantes. Je
suis prof d'école primaire et je sais combien
l'évaluation peut-être anxiogène pour
les élèves et pour le prof qui sait qu'il DOIT
noter (pour l'institution, pour les parents, et même
pour préparer les élèves à la
dure vie qui les attend), pas le choix... Et pourtant, nos
collègues finlandais, sans notes et à coup de
groupes de besoin, n'ont-ils pas tracé une voie plus
intéressante ? Respecter les rythmes de chacun, faire
confiance aux enfants, aux autres : plus qu'un choix c'est
une philosophie ! Et payante, par-dessus le "marché"
! allez, peace and love, y a qu'ça d'vrai ! >>
Lucie-24
<<Votre
'métaanalyse' est passionnante mais ne semble faire
qu'un constat impuissant de la situation. Que peut-on faire
pour améliorer la situation en particulier de la
fiabilité de correction par les enseignants ?
disposez-vous de résultats d'études décrivant
des méthodes de corrections qui s'approchent le plus
de ce que l'on pourrait appeler la note réelle (la
moyenne de 13 corrections de copie de math...) ? peut-on
définir les caractéristiques qu'un bon
évaluateur ? Je vais plus loin...est-il envisageable
de choisir les enseignants en fonction d'une évaluation
? les enseignants qui s'éloigneraient de trop de la
note 'réelle' seraient recalés ! (l'arroseur
arrosé :)>>
<<Enfin,
une étude qui interroge les limites d'un nombre qui
soit disant mesure les compétences d'un élève!
Que dire de certaines notations avec plusieurs chiffres
après la virgule comme 9,88 par exemple? Merci pour
votre page si riche de liberté de pensée! Bien
à vous>> Françoise
<<
Attention à ne pas oublier le contexte de plus en
plus concurrentiel que l'on crée entre les
établissements. Si le contrôle continu remplace
l'examen, l'objectif de la notation ne deviendra-t-il pas
d'obtenir de meilleurs résultats que l'établissement
voisin plutôt que d'essayer, plus ou moins bien,
d'apprécier les capacités des élèves.
De plus, en tant qu'enseignant en 3è, je n'ai jamais
constaté de différences importantes entre les
résultats obtenus par les élèves dans
l'année et ceux obtenus au brevet des collèges.
L'examen, avec tous ses défauts, garde donc
l'avantage de donner un cadre national aux enseignants et
donc des objectifs d'apprentissage commun et de ne pas
seulement agir en fonction de leur public. On peut imaginer
sinon que dans les établissements en difficulté
les enseignants reverraient sans cesse à la baisse
leurs exigences pour la réputation de leur
établissement. Il faut s'adapter à son
public,oui, mais ne pas se laisser entrainer par lui, ce
serait le risque en cas de suppression de l'examen. Enfin,
cela ne faciliterait pas l'orientation des élèves
de ces établissements dont la réputation
serait vite connue. Le caractère national de l'examen
lui donne une véritable valeur partout, ce qui ne
serait plus le cas avec le contrôle continu. Tout cela
dit, la réflexion sur la notation doit continuer,
elle est très intéressante et devrait être
plus diffusée. La perfection me semble impossible à
atteindre quand on a régulièrement 150 copies
à corriger mais cela n'empêche pas de chercher
à s'améliorer ! >>
<<Je
viens d'échouer à l'oral de l'agreg d'anglais.
La question qui me turlupine est : comment ai-je pu avoir
3/20 à l'oral en anglais et 14.5 à l'écrit
? J'ai eu des seconde il y a 2 ans et me suis aperçue
que, barême ou pas, je pouvais faire en sorte que
l'élève ait sa moyenne ou non... en
particulier si j'étais convaincue que le travail
récemment fourni était moindre, j'avais envie
que cela se vérifie grâce à la note
obtenue au contrôle (Mais une telle logique n'existe
que dans la tête du prof !). Bref, je me suis aperçue
que la correction objective n'existe pas, avec ou sans le
nom, car sans le nom on projette encore un élève
type comme expliqué dans votre article et on recrée
ce coupe enseignant/élève. Merci pour ce site
très intéressant, sans parler de sa
bibliographie, qui donne envie de creuser le sujet.>>
<<Excellent!!!
A diffuser d'urgence à tous les correcteurs du BAC
qui se lamentent sur les ondes de ne pouvoir "évaluer"
les copies selon leurs propres critères.>>
<<Merci
pour cet excellent site>>
<<En
tant qu'évaluateurs, ces informations nous aideront à
comprendre certaines erreurs que nous commettons lors de
cette activité.>>
<<Que
faites-vous des évaluations critétiées
et dichotomique? La qualité de l'évaluation
devrait être plus valable du fait qu'elle repose sur
des critères observables et mesurables. Pourtant
certains éléments viennent perturbés
l'évaluateur. Par exemple la pondération lié
au critère qui est jugée excessivement sévère
ou permisseve par l'évaluateur. Ou encore, la
mauvaise qualité dans le choix des éléments
d'observations...>>
<<Bonjour
et merci pour cet excellent aperçu. Vous laissez de
côté l'arme absolue contre tous les défauts
de l'évaluation : le QCM. Peu utilisé dans nos
contrées, il est abondant dans les pays anglo-saxons.
Sa mise en oeuvre est longue et difficile, mais la capacité
d'investiguer le savoir est beaucoup plus importante qu'on
ne croit généralement. En outre, la correction
est instantanée, voir automatisée.
Malheureusement, le QCM n'est pas universel et ne peut
s'appliquer à certaines matières.>>
<Bonjour,le
constat fiable établi par la docimologie se résume
donc à ceci : la probabilité qu'une copie
corrigée en deux instants différents (par un
même correcteur) ait une même note est nulle.>>
<<Bonjour
et merci pour votre aperçu de la question -
j'ajouterais comme référence moins sérieuse
mais tout aussi éloquente la planche de Gotlib (dans
Les Dingodossiers, publié entre 1965 et 1967) sur le
correcteur dans différentes situations de la vie de
tous les jours. En revanche je suis perplexe face à
votre conclusion sur l'organisation des études
supérieures en général. Quel est le
rapport entre la distance critique à avoir vis-à-vis
des notes, à laquelle vous nous invitez, et
l'ouverture tous azimuts des cursus au point de ne plus
ressembler à grand chose dans certains cas, avec les
crédits et la compensation ? Une véritable
possibilité de formation "tout au long de la
vie" n'empêche pas qu'on maintienne des notes et
même des concours ? De plus, l'anonymat des examens
type bac n'est-il pas aussi un garde-fou contre certains
défauts de correction, lorsqu'on croit trop bien
connaître ses élèves ?>>
<<Bonjour,
je suis une etudiante cadre de santé qui s'interroge
sur l'evaluation, la justesse d'une note?L'impact de
celle-ci?Votre étude me questionne d'avantage et me
laisse à penser que la note n'est pas et ne doit pas
être une finalité mais un moyen utilisé
en formation, en asociation avec une évaluation
formative.>>
<<que
penser des conditions financières des corrections qui
pourrait avoir une inffluence certaine sur ce travail?>>
<<Merci
pour ce résumé, cela m'a donné envie
d'approfondir le sujet. On parle ici de correcteurs
consciencieux, il reste à traiter la question des
conditions de corrections( délai, environnement)et
des réajustements académiques.>>
<<Au
lendemain des résultats de l'examen national classant
nous nous interrogeons sur la pertinence d'un concours qui
classe 50% des étudiants dans une fourchette de 100
points sachant que le concours comporte 9 dossiers notés
sur 100 points chacun et que ceci conditionne l'orientation
professionnelle de toute une vie>>
<<Bravo
pour la synthèse très claire. Suite à
ces conclusions sur les notes, que penser de la "note
de vie scolaire" , nouveauté de la rentrée
!>> Marie-Héléne 9/06
<<Je
suis une future prof aterrée par votre étude.
Et que fait-on maintenant? Comment réagirait le jury
du capes si je lui présentait ces résultats en
guise d'exposé d'oral?!>>
|
|