supertomate a écrit :Sauf erreur, la marge d'erreur, ça représente un intervalle dans lequel la valeur étudiée (le nombre de morts) a 95% de chance de se trouver, selon le modèle qu'on y a collé.
Et oui sauf que:
1- cela n'est pas présenté comme ça dans le texte:
La marge d'erreur pour cette étude est de 1,7%, ce qui donne une fourchette de décès entre 946.000 et 1,12 million.
Il manque les 95%...
Je partage cette critique. Mais c'est déjà pas mal pour un journaliste de parler de l'intervalle d'erreur. (La plupart du temps, quand on cite un sondage, on dit que X% des français aiment bien la dernière coupe de cheveux de Carla Bruni, plutôt que de dire que sur un échantillon de 2000 mesures, tel modèle de distribution donne un intervalle de confiance de a +/- b pour le nombre de français qui apprécient la nouvelle coupe.)
supertomate a écrit :
2- là, j'vais expliquer un truc que j'ai jamais compris (longues discussions avec le prof de stat, du reste si quelqu'un est motivé pour m'expliquer, mon MP est grand ouvert)), désolé si ce n'est pas clair:
dans lequel la valeur étudiée (le nombre de morts) a 95% de chance de se trouver
Le nombre de mort n'a pas 95% de chance de se trouver dans l'intervalle. Le nombre réél de mort existe (ce n'est plus une proba, c'est une valeur existante) et est ou n'est pas dans l'intervalle.
Ahah, ça, c'est une finesse que les profs ne savent pas expliquer, et qui m'a conduit à ne pas tellement faire de statistique.
Quand on dit "l'intervalle de confiance pour le nombre de morts est [a,b]", on donne une approximation. La formulation sous forme de probabilité d'un nombre réel qui n'a qu'une seule valeur bien définie provient du fait qu'on a pas les moyens de calculer ce nombre de manière exacte.
A la place de parler du vrai nombre de mort, on parle de la valeur aléatoire par laquelle on modélise ce nombre, et en fonction de quelques valeurs mesurées sur le terrain, qui ne sont pas le nombre réel de morts, mais des quantités qui en dépendent (nombre de corps qui sont passés par chaque morgue, nombre de corps enterrés sans passer par une morgue, etc.), on affine le modèle de manière à ce que l'intervalle de cconfiance de la valeur aléatoire traitée soit assez petit pour être représentatif, et on obtient cet intervalle [a,b] dans lequel notre modèle dit que le nombre réel a beaucoup de chance de se trouver.
Forcément, pour présenter le résultat sans faire un cours de math, on doit passer par un raccourcis, et présenter le résultat comme une approximation ("Le nombre de victimes civiles serait actuellement entre a et b.")
Pour reprendre l'exemple traité, on est sur, par des mesures sur le terrain, qu'il y a eu des morts civils en Irak. On sait même qu'il y en a eu plus de 200'000. Mais dire qu'il y en a eu plus de 200'000, en ne comptant que ceux pour lesquels on a une certitude, c'est un peu maigre. On estime ce qu'on ne connait pas par un modèle.