Réserves de pétrole : erreur d'étudiant de première année
Publié : 30 mai 2013, 13:41
ce message vise un relever un soucis mathématique avec la définition des réserves de pétrole.
Pour tout le monde, cela parait évident : les ingénieurs pétroliers évaluent des réserves pour chaque gisement, puis on somme les réserves de tous les gisements d'un pays, puis celles de tous les pays , pour avoir les réserves mondiales.
C'est bien comme que les compagnies pétrolières, les gouvernements, l'EIA, l'OPEP, et ainsi de suite procèdent.
Sauf que c'est une erreur.
Cette affirmation parait heurter la logique élémentaire. Pour l'expliquer, il faut revenir sur la définition des réserves.
La quantité de pétrole que l'on pourra extraire d'un gisement n'est pas connue exactement, on procède en général a trois
estimations, basse, moyenne haute, que l'on note P90, P50, P10,et que l'on surnomme réserves "prouvées", "probables" et "possibles".
Ainsi, si l'on écrit qu'un gisement a des réserves prouvées de 1200 millions de barrils et possibles de 1600 millions de barrils, il faut lire "il y a 90% de chances qu'on extraie au moins 1200 Mb de ce gisements, et 10% de chances qu'on extraie au moins 1600 millions de barrils".
On a donc en réalité donné deux quantiles de la variable aléatoire "quantité de pétrole qui sera extrait".
Hors, une propriété fondamentale des variables aléatoire est que les quantiles ne sont pas additifs.
Par exemple, si je lance un dé, j'ai un quantile de probabilité 1/6 et de valeur 6 : c'est à dire que j'ai une chance sur 6 s'obtenir "au moins 6". Mais si je lance deux dés, je n'ai pas une chance sur 6 d'obtenir "au moins 12", mais seulement une chance sur 36.
Les quantiles ne deviennent additif que si les variables sont parfaitement corrélées l'une à l'autre.
Pour illustrer le problème , j'imagine une petite province pétrolière, elle n'existe pas, les réserves (p90 et p10) et les noms des gisements sortent de mon imagination.
Gisement P90 P10
Entrecôte 2700 3800
Faux-Filet 750 1225
Bavette 550 900
Rumsteck 500 650
Onglet 200 275
Tendron 150 200
Hampe 75 150
Bajoue 65 120
Tournedos 40 80
Si l'on procède bêtement à la somme des réserves on trouve des totaux P10=7400 et P90=5030
Je procède à une petite simlulation montecarlo, le procédé consiste à effectiver N tirages des variables aléatoires, ici je fixe N = 10000, et à effectuer des statistiques sur les résultats. Je (enfin l'ordi!) procède donc à 10 000 tirages, pour chaque tirage, l'ordinateur prend pour chaque gisement une valeur aléatoire selon une loi gaussienne, dont la moyenne et l'écart-type sont fixés pour coller aux valeurs données de P90 et P10.
L'utilisation d'une loi normale (ou gaussienne) a pour conséquence que les réserves P50 sont exactement égales à la moyenne des P10 et P90, et à la valeur la plus probable, celà n'est pas vrai de façon générale (avec d'autres loi de répartition). Après les 10 000 tirages, j'obtient donc 10 000 valeurs de réserves possibles pour la somme des gisements, plus qu'à les ordonner pour obtenir la loi de probabilié du total.
J'obtient P90 = 5580, et P10 = 6850. Soit une fourchette nettement plus petites que celle obtenues en sommant les chiffres individuels : l'écart entre P10 et P90 est à peu près réduit de moitié !
Conclusion : en sommant bêtement les gisements, on surévalue considérablement les réserves possibles, mais on sous évalue les réserves prouvées !
Pour tout le monde, cela parait évident : les ingénieurs pétroliers évaluent des réserves pour chaque gisement, puis on somme les réserves de tous les gisements d'un pays, puis celles de tous les pays , pour avoir les réserves mondiales.
C'est bien comme que les compagnies pétrolières, les gouvernements, l'EIA, l'OPEP, et ainsi de suite procèdent.
Sauf que c'est une erreur.
Cette affirmation parait heurter la logique élémentaire. Pour l'expliquer, il faut revenir sur la définition des réserves.
La quantité de pétrole que l'on pourra extraire d'un gisement n'est pas connue exactement, on procède en général a trois
estimations, basse, moyenne haute, que l'on note P90, P50, P10,et que l'on surnomme réserves "prouvées", "probables" et "possibles".
Ainsi, si l'on écrit qu'un gisement a des réserves prouvées de 1200 millions de barrils et possibles de 1600 millions de barrils, il faut lire "il y a 90% de chances qu'on extraie au moins 1200 Mb de ce gisements, et 10% de chances qu'on extraie au moins 1600 millions de barrils".
On a donc en réalité donné deux quantiles de la variable aléatoire "quantité de pétrole qui sera extrait".
Hors, une propriété fondamentale des variables aléatoire est que les quantiles ne sont pas additifs.
Par exemple, si je lance un dé, j'ai un quantile de probabilité 1/6 et de valeur 6 : c'est à dire que j'ai une chance sur 6 s'obtenir "au moins 6". Mais si je lance deux dés, je n'ai pas une chance sur 6 d'obtenir "au moins 12", mais seulement une chance sur 36.
Les quantiles ne deviennent additif que si les variables sont parfaitement corrélées l'une à l'autre.
Pour illustrer le problème , j'imagine une petite province pétrolière, elle n'existe pas, les réserves (p90 et p10) et les noms des gisements sortent de mon imagination.
Gisement P90 P10
Entrecôte 2700 3800
Faux-Filet 750 1225
Bavette 550 900
Rumsteck 500 650
Onglet 200 275
Tendron 150 200
Hampe 75 150
Bajoue 65 120
Tournedos 40 80
Si l'on procède bêtement à la somme des réserves on trouve des totaux P10=7400 et P90=5030
Je procède à une petite simlulation montecarlo, le procédé consiste à effectiver N tirages des variables aléatoires, ici je fixe N = 10000, et à effectuer des statistiques sur les résultats. Je (enfin l'ordi!) procède donc à 10 000 tirages, pour chaque tirage, l'ordinateur prend pour chaque gisement une valeur aléatoire selon une loi gaussienne, dont la moyenne et l'écart-type sont fixés pour coller aux valeurs données de P90 et P10.
L'utilisation d'une loi normale (ou gaussienne) a pour conséquence que les réserves P50 sont exactement égales à la moyenne des P10 et P90, et à la valeur la plus probable, celà n'est pas vrai de façon générale (avec d'autres loi de répartition). Après les 10 000 tirages, j'obtient donc 10 000 valeurs de réserves possibles pour la somme des gisements, plus qu'à les ordonner pour obtenir la loi de probabilié du total.
J'obtient P90 = 5580, et P10 = 6850. Soit une fourchette nettement plus petites que celle obtenues en sommant les chiffres individuels : l'écart entre P10 et P90 est à peu près réduit de moitié !
Conclusion : en sommant bêtement les gisements, on surévalue considérablement les réserves possibles, mais on sous évalue les réserves prouvées !