L’extraction d’informations biochimiques à partir d’anciens sédiments riches en matières organiques, notamment le moment de l’émergence de la photosynthèse par rapport à l’oxygénation déduite de l’atmosphère terrestre, reste une opportunité difficile. Pour résoudre ce problème, les scientifiques ont analysé 406 échantillons anciens et modernes et ont utilisé l’apprentissage automatique supervisé pour distinguer les échantillons d’origine biogénique et abiogénique, ainsi que la physiologie photosynthétique et non photosynthétique. Ils ont trouvé des preuves chimiques d’assemblages moléculaires biogéniques dans les roches paléoarchéennes (il y a 3,51 milliards d’années) et de vie photosynthétique dans les roches néoarchéennes (il y a 2,52 milliards d’années).
Les premières formes de vie sur Terre ont laissé peu de traces moléculaires.
Les quelques restes fragiles, tels que des cellules anciennes et des tapis microbiens, ont été enfouis, écrasés, chauffés et fracturés dans la croûte terrestre agitée avant d’être repoussés à la surface.
Ces transformations ont pratiquement effacé les biosignatures contenant des indices vitaux sur les origines et l’évolution précoce de la vie.
Les paléobiologistes qui recherchent des signes de la vie la plus ancienne sur Terre se sont longtemps appuyés principalement sur des organismes fossiles, y compris des fossiles microscopiques de cellules et de filaments uniques, ainsi que sur les restes minéralisés de structures cellulaires telles que des tapis microbiens et des stromatolites en forme de monticule, qui fournissent des preuves convaincantes d’une vie remontant à 3,5 milliards d’années. Cependant, ces vestiges sont rares.
Une deuxième source de données repose sur la préservation de biomolécules diagnostiques dans les roches anciennes.
Les molécules organiques les plus résistantes de la vie – celles dérivées des membranes cellulaires ou de certains processus métaboliques – ont été trouvées dans des sédiments vieux de 1,7 milliard d’années, tandis que des roches beaucoup plus anciennes, riches en carbone, préservent des signatures isotopiques qui suggèrent une biosphère dynamique il y a 3,5 milliards d’années.
Cependant, la plupart des roches anciennes ne conservent ni cellules fossiles ni biomolécules survivantes.
La grande majorité des anciens sédiments carbonés ont été chauffés et modifiés de manière à briser chaque biomolécule diagnostique en d’innombrables petits fragments.
Ces fragments se sont révélés trop petits et trop génériques pour fournir des indices sur la vie ancienne – jusqu’à présent.
« Les roches anciennes regorgent d’énigmes intéressantes qui nous racontent l’histoire de la vie sur Terre, mais il manque toujours quelques pièces », a déclaré Katie Maloney, chercheuse à la Michigan State University et co-auteur de l’étude.
« L’association de l’analyse chimique et de l’apprentissage automatique a révélé des indices biologiques sur la vie ancienne qui étaient auparavant invisibles. »

Les chercheurs ont utilisé une analyse chimique à haute résolution pour décomposer les matériaux organiques et inorganiques en fragments moléculaires, puis ont formé un système d’IA pour reconnaître les « empreintes digitales » chimiques laissées par la vie.
Ils ont examiné un total de 406 échantillons fossiles, biologiques modernes, météoritiques et synthétiques.
Le modèle d’IA a distingué les matériaux biologiques des matériaux non biologiques avec une précision de plus de 90 % et a détecté les premières preuves biomoléculaires pour :
(i) les origines photosynthétiques des molécules organiques dans la formation de Gamohaan, vieille de 2,52 milliards d’années, groupe de Campbellrand, en Afrique du Sud, et dans le groupe de Gowganda, vieux de 2,30 milliards d’années, en Ontario, Canada ;
(ii) la biogénicité des molécules organiques préservées dans le craton Singhbhum, vieux de 3,51 milliards d’années, en Inde ; le chert Josefsdal, vieux de 3,33 milliards d’années, de la ceinture de roches vertes de Barberton, en Afrique du Sud ; et la formation Jerrinah, vieille de 2,66 milliards d’années, groupe Fortescue, craton de Pilbara, Australie ;
(iii) et l’origine apparemment non photosynthétique d’espèces organiques dans la Formation de Theespruit, vieille de 3,5 milliards d’années, dans la ceinture de roches vertes de Barberton, en Afrique du Sud, et dans la Formation de Dresser, vieille de 3,48 milliards d’années, dans le craton de Pilbara, en Australie.
« La vie ancienne laisse bien plus que des fossiles ; elle laisse des échos chimiques », a déclaré l’auteur principal, le Dr Robert Hazen, chercheur à la Carnegie Institution for Science.
« Grâce à l’apprentissage automatique, nous pouvons désormais interpréter ces échos de manière fiable pour la première fois. »
« Cette technique innovante nous aide à lire les archives fossiles des temps profonds d’une nouvelle manière », a ajouté le Dr Maloney.
« Cela pourrait aider à guider la recherche de la vie sur d’autres planètes. »
« Comprendre quand la photosynthèse est apparue permet d’expliquer comment l’atmosphère terrestre est devenue riche en oxygène, une étape clé qui a permis à des formes de vie complexes, y compris les humains, d’évoluer », a déclaré le premier auteur, le Dr Michael Wong, également de la Carnegie Institution for Science.
« Cela représente un exemple inspirant de la façon dont la technologie moderne peut mettre en lumière les histoires les plus anciennes de la planète et pourrait remodeler la façon dont nous recherchons la vie ancienne sur Terre et dans d’autres mondes. »
« À l’avenir, nous prévoyons de tester des matériaux tels que les bactéries photosynthétiques anoxygéniques, analogues possibles des organismes extraterrestres. Il s’agit d’un nouvel outil puissant pour l’astrobiologie. »
« Ces échantillons et les signatures spectrales qu’ils produisent sont étudiés depuis des décennies, mais l’IA offre une nouvelle lentille puissante qui nous permet d’extraire des informations critiques et de mieux comprendre leur nature », a ajouté le Dr Anirudh Prabhu de la Carnegie Institution for Science, co-auteur de l’étude.
« Même lorsque la dégradation rend difficile la détection des signes de vie, nos modèles d’apprentissage automatique peuvent toujours détecter les traces subtiles laissées par d’anciens processus biologiques. »
« Ce qui est passionnant, c’est que cette approche ne repose pas sur la découverte de fossiles reconnaissables ou de biomolécules intactes. »
« L’IA ne nous a pas seulement aidé à analyser les données plus rapidement, elle nous a également permis de donner un sens à des données chimiques désordonnées et dégradées. »
« Cela ouvre la porte à l’exploration d’environnements anciens et extraterrestres avec une nouvelle perspective, guidée par des modèles que nous ne connaissons peut-être même pas pour rechercher par nous-mêmes. »
Les résultats de l’équipe paraissent cette semaine dans les Actes de l’Académie nationale des sciences.
