Frédérique Letué est maître de conférence en statistique au Département STID de Grenoble, membre du bureau du groupe Enseignement de la SfdS.
par Frédérique Letué
Cet article peut être librement diffusé et son contenu réutilisé pour une utilisation non commerciale (contacter l’auteur pour une utilisation commerciale) suivant la licence CC-by-nc-sa (http://creativecommons.org/licenses/by-nc-sa/3.0/fr/legalcode)
NDLR : l’ouverture des liens dans une nouvelle fenêtre (clic droit, nouvelle fenêtre) permet une lecture fluide de l’article.
Auteur : Frédérique Letué [1]
Frederique.Letue@iut2.upmf-grenoble.fr
Le but de cet article est de présenter un panorama des filières, accessibles après le bac, qui allient des enseignements de statistique et d’informatique dans l’enseignement supérieur public en France métropolitaine.
Dans un premier temps, nous présentons les différentes étapes de la démarche statistique en montrant dans quelles mesures elles s’appuient sur les mathématiques, l’informatique, voire d’autres disciplines. Dans une deuxième partie, nous présentons les différentes formations post-bac jusqu’à bac +3, en insistant volontairement sur les moins connues d’entre elles : DUT Statistique et Informatique Décisionnelle, licences professionnelles de statistique, parcours des licences de mathématiques préparant aux masters de statistique, licences de Mathématique et Informatique appliquées aux Sciences Humaines et Sociales (anciennes licences MASS), en finissant par un rapide aperçu sur quelques écoles d’ingénieurs spécialisées en statistique, auxquelles on peut accéder après des classes préparatoires aux grandes écoles.
Cette présentation s’appuie sur une revue diffusée par l’ONISEP et la Société Française de Statistique intitulée « les métiers de la statistique ». Elle fait notamment appel à des vidéos diffusées sur le site de la SFdS, présentant des interviews filmées d’anciens étudiants, réalisées à l’occasion de la préparation de cette revue. Elle présente également des cartes des différentes formations, avec des liens sur leurs sites.
1. Allier statistique et informatique
La sélection des formations ci-dessous a été essentiellement faite selon la part de l’enseignement de probabilités et de statistique. Dans la plupart de ces formations, on notera la présence d’un enseignement important d’informatique accompagnant ceux de statistique. Pour bien comprendre comment a été pensée cette articulation statistique-informatique, il faut bien avoir en tête la démarche statistique :
- La statistique consiste à répondre à une question posée par d’autres sciences (biologie, médecine, économie, psychologie, etc.) ou par la société, à l’aide d’un jeu de données. La première qualité d’un statisticien est donc sans doute de bien savoir dialoguer avec d’autres sciences pour bien comprendre la nature des données présentes dans le jeu de données et la question posée ;
- Les données sur lesquelles va travailler le statisticien ont été collectées et saisies informatiquement. Ces deux étapes peuvent être séparées (questionnaires ou relevés expérimentaux ou de terrain sur papier, puis saisie informatique), mais sont de plus en plus souvent simultanées (formulaires on-line, logiciels de statistique, etc.) afin de limiter au maximum les erreurs de saisie. Le statisticien doit donc savoir comment a été réalisée cette collecte, être conscient des biais induits par la collecte elle-même. Pour cela, il doit être formé à la création, la gestion, la maintenance, l’interrogation des bases de données, via des logiciels (Oracle, MySQL, …). Parfois, un simple tableur sera suffisant pour créer une base de données simple. D’autres fois en revanche, il faudra faire appel à des systèmes de gestion de bases de données spécialisés dans un domaine d’application : ERP ( entreprise ressource planning , destiné à la gestion des données d’entreprises), SIG (systèmes d’information géographique, dédié à la gestion des données spatialisées) ;
- Une fois les données récoltées, le premier travail du statisticien est le nettoyage des données. Le statisticien doit en effet savoir quelle fiabilité accorder à ses données ;
- L’analyse statistique proprement dite commence par une étape de statistique descriptive ou exploratoire. Le statisticien doit avoir une idée de la direction dans laquelle il va pouvoir chercher la réponse à sa question. Il construit alors des tableaux, des graphiques, des indicateurs lui permettant de résumer ses données, sans recours aux modèles probabilistes. La statistique exploratoire multidimensionnelle, aussi appelée analyse de données, fait appel à des notions d’algèbre linéaire ;
- Nuage de points entre le poids de bébés à la naissance, le nombre de jours de gestation, l’âge, la taille, le poids et la tension de la mère en fonction du statut tabagique de la mère et de la parité de la naissance
- Vient ensuite l’étape de statistique inférentielle qui va lui permettre de répondre aux questions initiales, de tirer des conclusions et de prendre des décisions. Celle-ci est essentiellement basée sur la statistique mathématique, dont l’objet est de construire des estimateurs et des tests statistiques, dont on sait prouver mathématiquement, à travers des théorèmes, les propriétés. Elle s’appuie sur des modèles probabilistes et nécessite des notions d’analyse. Le statisticien est parfois amené à illustrer certains de ces résultats par des simulations, faisant alors appel à l’analyse numérique (pour des problèmes d’optimisation mathématique, par exemple) ou à l’algorithmique et à la programmation (pour des problèmes d’optimisation numérique) ;
- Pour appliquer les deux étapes de statistique (descriptive et mathématique) à son jeu de données, le statisticien utilise des logiciels spécialisés de statistique, que ce soit des logiciels du marché (SAS, SPSS, Statistica, Sphinx, Stata…) ou des logiciels libres comme R ;
- En outre, le statisticien doit également être capable à l’issue d’une étude de présenter ses résultats aux commanditaires de l’étude. Ils doivent donc être capables de rédiger un rapport écrit ou un article scientifique, de présenter un exposé oral, aussi bien en français qu’en anglais, voire de concevoir des posters. La maîtrise des logiciels de bureautique usuels, des langues française et anglaise est donc également indispensable.
2. Des filières post-bac alliant statistique et informatique
Dans cette partie, nous présentons les filières post-bac reposant sur une part importante de statistique et d’informatique, en montrant comment chacune d’entre elles se positionne par rapport à la démarche statistique présentée ci-dessus. Nous avons utilisé des blocs que le lecteur peut déplier.
3. Conclusion
Au final, il est tout à fait possible pour un bachelier scientifique, mais également un bachelier L spécialité « mathématiques », STMG spécialité « gestion des systèmes d’information », STI2D spécialité « systèmes d’information et numérique », STL, de trouver une formation juste après bac avec une forte part d’enseignements de probabilités ou de statistique. Les enseignants de mathématiques de l’enseignement secondaire doivent en être conscients, car la statistique constitue un moyen d’exercer les mathématiques en entreprise. Les lycéens doivent comprendre que des études de mathématiques ne mènent pas qu’aux métiers de l’enseignement mais offrent des parcours passionnants dans d’autres secteurs d’activités. De plus, ce secteur est en pleine expansion, notamment à l’heure du « big data » [3], où les masses de données stockées par les entreprises et sur internet requièrent de plus en plus de statistique pour être traitées. Les domaines d’activité et les métiers y sont variés. Pour vous en convaincre, vous pouvez également visionner la conférence Horizons de la statistique, conférence de clôture de l’année mondiale de la statistique.