En utilisant une suite de techniques d’apprentissage par renforcement, nos politiques peuvent être optimisées dans de nombreux scénarios complexes, tels que la gestion des aquifères, la production de pétrole, l’injection de CO2 et autres.
Par exemple, dans le cas de la gestion des aquifères, nous pouvons réguler automatiquement la production d’eau en fonction des réserves d’eau disponibles par rapport au régime pluviométrique variable.
De même, pour optimiser la production de pétrole / gaz, nous pouvons la réguler automatiquement en reliant la récompense RL au risque d’invasion d’eau dans le puits de production. Un tel risque est estimé à l’aide de la tomographie DC/AC de forage.
L’approche générale du progiciel consiste à utiliser l’apprentissage par renforcement profond pour créer un système de politique d’optimisation automatique capable de prendre en charge les décisions de gestion dans divers scénarios dynamiques.
Paolo Dell’Aversana