Sur un enregistrement produit suite à un tir sismique, on peut observer les différents modes the propagation des ondes dans le sol (figure 1). La première arrivée, également connue sous le nom de "first break" en anglais, correspond au temps de propagation de l'onde sismique directe ou réfractée depuis la source jusqu'aux géophones, selon celle qui arrive en premier dans son parcours. Ces premières arrivées fournissent des informations inestimables pour comprendre les caractéristiques de la proche surface. Elles peuvent être utilisées, entre autres, pour analyser les réfractions, obtenir un modèle de vitesse de la proche surface et connaître la profondeur du socle rocheux. De plus, elles peuvent servir en complément dans le traitement de méthodes plus complexes comme la sismique réflexion.
Traditionnellement, l’identification des premières arrivées est effectuée manuellement par un expert, une étape de traitement longue et subjective menant souvent à des résultats qui diffèrent d’une personne à l’autre. Pour surmonter ce problème, différentes méthodes ont été développées pour automatiser la procédure, telles que la méthode STA/LTA (short-time-average over long-time average) et les méthodes basées sur la corrélation du signal sismique avec des formes d’ondes connues. Cependant, l'efficacité de l’ensemble de ces méthodes diminue considérablement lorsque les données sont bruitées (Figure 2).
Chez Géostack, nous avons conçu des outils utilisant l’intelligence artificielle pour automatiser avec précision l’identification des premières arrivées, et ce tant pour les données propres (Figure 3a à c) que bruitées (Figure 3d à f). Cela fait partie de nos efforts visant à réduire le temps de traitement de nos méthodes combinées tout en fournissant des résultats de haute qualité. En utilisant ces nouveaux outils, nous pouvons ainsi garantir à nos clients que les projets seront livrés dans les délais et dans le respect du budget.
Comment fonctionnent ces outils?
Nous avons d’abord créé un jeu de données sismiques comprenant des enregistrements bruts de tirs sismiques pour lesquels nous avons identifié manuellement les premières arrivées. Ces données ont ensuite été utilisées pour entraîner un réseau de neurones convolutifs (CNN), un type d'algorithme d'intelligence artificielle spécialisé dans le traitement des données visuelles. Une fois le modèle entraîné sur notre jeu de données initial, ce dernier peut alors déjà servir à trouver et identifier les premières arrivées dans d'autres enregistrements sismiques, mais avec une précision qui est parfois limitée.
Pour améliorer la précision des résultats dans nos projets, nous utilisons l’apprentissage par transfert (transfer learning), une technique d'apprentissage automatique permettant d’utiliser un modèle préentraîné sur une tâche comme point de départ pour accélérer et améliorer l’apprentissage d'une nouvelle tâche similaire ou apparentée. Concrètement, cela implique que pour chaque projet, nous identifions d’abord manuellement les premières arrivées sur 5 à 10 % des enregistrements sismiques. Nous utilisons ensuite ces nouvelles données pour réentraîner un modèle d’IA permettant d’identifier de façon précise les premières arrivées des enregistrements sismiques restants. En tirant parti de l'apprentissage par transfert, nous bénéficions donc des connaissances et des fonctionalités acquises à partir du jeu de données d'entraînement initial, puis nous affinons le modèle pour l'adapter spécifiquement aux caractéristiques de chaque nouveau projet. Cette approche nous permet d'atteindre un niveau de précision supérieur dans l'identification des premières arrivées, même dans des scénarios de données sismiques difficiles, tout en réduisant considérablement l'effort manuel et le temps nécessaires pour étiqueter les données.
Par exemple, les figures 3d à 3f présentent des enregistrements sismiques d’un jeu de données bruitées pour lequel nous avons d’abord identifié manuellement les premières arrivés sur environ 7% des enregistrements (20 enregistrements sur 291). Par la suite, il nous a fallu moins de temps qu'il n'en faut pour se faire un café pour entraîner un nouveau modèle d’IA et identifier avec précision les premières arrivées sur les 271 enregistrements restants. Le flux de travail que nous avons ainsi développé permet non seulement de réduire de manière significative le temps de traitement, mais aussi la subjectivité des résultats et les risques d’erreurs humaines.
Nous avons intégré cet outil d’identification automatique des premières arrivées à notre logiciel interne, ce qui nous permet d'évaluer les premières arrivées sélectionnées et de les modifier rapidement en cas d'inexactitude. Un exemple d’utilisation de l’outil au sein de notre logiciel est présenté à la figure 4. La combinaison de l'automatisation basée sur l'intelligence artificielle et de l'évaluation en temps réel au sein de notre logiciel s'est révélée être une solution puissante pour améliorer nos capacités de traitement des données sismiques, nous permettant de fournir des solutions de traitement des données sismiques plus fiables et efficaces à nos clients.
Enfin, en accord avec notre engagement envers l'open source, nous avons rendu disponible gratuitement le code source de ce nouvel outil sur notre page GitHub. En rendant le code source accessible en open source, nous avons pour objectif de contribuer à la communauté géophysique dans son ensemble et à promouvoir la collaboration et l’innovation dans le traitement des données sismiques. Nous encourageons les chercheurs, les praticiens et les développeurs à explorer et à utiliser l'outil, à fournir des commentaires et même à contribuer à son amélioration.
Comments