mercredi 13 mars 2019

épisode 137 : Vivent les maths




Aujourd'hui c'est mercredi, et comme chaque mercredi on fait passer les TPE aux élèves de première. Et en sciences, les TPE c'est pas toujours réussi. En effet, il y a deux sortes de TPE, ceux qui maîtrisent leur sujet et les autres. Malheureusement, ces derniers représentent un pourcentage bien trop important. Concernant les pourcentages justement, penchons nous un peu sur ce que les élèves pensent être des mathématiques.


Mais avant, pour vous qui n'êtes pas forcément dans le métier ou qui avez quitté le système scolaire pré-baccalauréat depuis un bout de temps, remettons les choses en contexte. Les TPE, ou Travaux Personnels Encadrés, sont une épreuve du bac général qui se présente sous la forme d'une recherche débouchant sur un exposé et un rapport écrit. En gros, il s'agit d'une version lycée d'un travail de recherche supérieur avec son mémoire de recherche. Déjà, voir des élèves ne même pas savoir ce que l'acronyme veut dire, ça pique salement les yeux. Oui, bon, je sais, l'éducation nationale balance toujours trop de sigles et d'acronymes imbittables, mais quand même... Taffer six mois sur un truc et ne même pas connaître le nom du truc en question...

Selon les classes, les élèves doivent trouver un sujet respectant uniquement deux conditions : suivre les matières enseignées par leurs encadrants et correspondre aux thèmes de l'année en cours. Les thèmes sont assez vagues et interprétables pour qu'on puisse y balancer un peu n'importe quoi. En revanche, y mettre des mathématiques, ça semble bien plus compliqué pour la majorité des jeunes lycéens. Et même en première S, pour beaucoup, les maths c'est juste des nombres. Ahlala les pauvres enfants, c'est tellement restreint et nul comme vision des maths, mais tant pis.  Donc mettre des maths dans une étude revient juste à plaquer une chiée de nombres par dessus. Et quoi de mieux que des statistiques ou des pourcentages ?

Il y a trois semaines je m'affligeais du niveau d'obscurantisme galopant actuel. Et les statistiques personne ne sait s'en servir, à commencer par les politiciens et tous les autres charlatans qui veulent nous faire gober de la merde par paquet de 15 kilos. Mais le problème, c'est qu'on n'a même plus les connaissances pour se rendre compte qu'on nous dit n'importe quoi. Pour s'en convaincre, il suffit de voir comment des futurs étudiants en science utilisent des statistiques. Bien sûr, pour des raisons évidentes les exemples suivants sont anonymes, modifiés et toute ressemblance avec des TPE ayant réellement existé serait purement fortuite.



La voiture du turfu

Les véhicules autonomes façon Google Car c'est vraiment l'avenir parce que c'est d'une fiabilité à toute épreuve. Ben oui, rendez vous compte, en 2018, en France les véhicules conventionnels font plus de 200 morts par mois, et les voitures autonomes seulement 1 mort sur toute l'année.
Les journalistes font tous la même connerie... Mais comment voulez vous comparer les millions de véhicules français au nombre bien plus restreint de véhicules autonomes, en phases de test, autorisés à rouler sur des zones spécifiques.... 




Souvent l'âge varie, bien fol qui s'y fie

Quand on ne sait pas quoi faire pour faire des maths, on rajoute un petit sondage pour en effectuer une étude statistique. Ineptie pour la majorité des cas. On étudie par exemple le nombre de cas de pararibulitis dans la population française. Pour cela le mode opératoire est souvent identique, on mitonne un petit questionnaire à envoyer au plus grand nombre et on dépouille les réponses avec les connaissances statistiques dont on dispose.
Et immanquablement on tombe dans deux erreurs béantes. La première question étant l'âge du sondé, que se passe-t-il quand on prend cette réponse comme série statistique ?
On a beau avoir calculé des moyennes, des médianes, des quartiles, des écarts types et autres joyeusetés statistiques, et bien on a fait tout ça simplement sur l'âge des gens qui ont répondu au questionnaire. Et du coup, quel rapport avec le pararibulitis ? Aucun bien sûr ! Mais on a une étude statistique très poussée des gens touchés non par la maladie étudiée mais par la diffusion du questionnaire... Intéressant mais totalement hors sujet...
Et si on a compris le truc, on finit quand même par tomber dans l'autre erreur typique. À votre avis, qui est touché par un questionnaire diffusé par des élèves ou par l'administration d'un lycée ? Et bien globalement d'autres élèves et des parents d'élèves. Soit à peu près plus de 50% de gens entre 15 et 19 ans, et quasiment tout le reste entre 35 et 50 ans. Pas tellement représentatif de notre population tout ça non ? Et du coup, quelle valeur peut avoir un résultat indiquant un pic de pararibulitis autour de 18 ans si on ne tient pas compte des tranches d'âge complètement absentes de notre étude ? Aucune bien sûr !




Mais il ne s'agit pas de jeter (uniquement) la pierre aux élèves, ni de s'autoflageller en dénigrant la qualité de l'enseignement pratiqué à ces chèrs écolièrs. Nous baignons de tous les côtés dans des inepties statistiques, et ce, depuis des années. Le titre des Échos ci-dessus est-il vrai ou faux ? On va admettre que c'est vrai, mais c'est débile. Une preuve supplémentaire que les statistiques, chacun essaye de leur faire dire n'importe quoi. Eh oui, réfléchissez un peu. Ça veut dire que trois accidents sur quatre sont dus à des gens sobres. Sans plus d'information, logiquement il faut donc en déduire que picoler avant de prendre la route c'est plus sûr !
La base, que chacun devrait éviter de perdre de vue, c'est la population globale qu'on étudie. On ne peut pas comparer proprement des trucs qui ne font pas partie du même ensemble. Et surtout, ne pas donner l'ensemble qu'on étudie, c'est de la manipulation purement et simplement. Et je ne sais pas ce qui est pire : qu'elle soit volontaire ou juste due à de l'incompétence. Par exemple, avancer que l'exposition à l'une ou l'autre substance soi-disant cancérigène augmente de 50% le risque de cancer quand on double la dose peut s'avérer une non-information. Surtout si l'on ne précise pas que les cancers liés à la dite substance ne sont que deux cas sur 500. Forcément, une augmentation du nombre de malades de 50% ça revient alors à avoir 3 cas sur 500. Mais ça reste toujours trop faible pour faire un quelconque lien avec la substance incriminée.

Les statistiques, non seulement on leur fait vraiment dire n'importe quoi, mais il faut surtout savoir les décrypter pour ne pas se faire entuber par le premier gugusse venu (le gugusse fut-il un ou une candidate aux plus hautes fonctions du pays). Et je n'ai pas la prétention de fournir ici de quoi éviter de se faire avoir, j'espère simplement que les exemples précédents, et un soupçon d'esprit critique, permettront d'y voir un peu plus clair. Et pour finir, une petite citation britannique :

"Je ne crois aux statistiques que lorsque je les ai moi-même falsifiées."


4 commentaires:

  1. Les britanniques font des citations en français ?

    Ceci dit, merci de me confirmer que j'ai raison de boire avant de conduire et que finalement fumer des cellules cancéreuses ne serait pas si dangereux que ça ^^

    RépondreSupprimer
  2. voici la version en VO alors : "Traue keiner Statistik, die du nicht selber gefälscht hast"

    et je nie toute responsabilité dans l'interprétation que vous faites des statistiques balancées par un quidam inconnu sur le net (ceci dit, la prochaine fois que comptez boire avant de prendre la route tout en ayant fumé, n'hésitez pas à me prêter au préalable une forte somme d'argent !)

    RépondreSupprimer
  3. Ont vous ment !16 mars 2019 à 10:40

    Je suis bien d'accord que la plupart du temps, les statisticien qu'on entend le plus, n'y comprennent que dalle.

    N'oublions pas tout de même, se glorieux site internet qui sais faire la part des choses
    http://www.tylervigen.com/spurious-correlations

    RépondreSupprimer
  4. l'âge de Miss America corrélé avec le nombre de meurtres "à la vapeur".. fabuleux :)

    RépondreSupprimer