La «calculette de la mort»Des chercheurs danois élaborent un algorithme pour prédire la vie... et la mort
Relax
24.3.2024 - 18:24
(AFP) – Un algorithme pour prédire les étapes de la vie jusqu'à sa fin: des chercheurs d'une université danoise ont élaboré un modèle surnommé «calculette de la mort», qui permet de sensibiliser aux risques d'un détournement commercial des données.
24.03.2024, 18:24
Relax
«C'est un cadre très général permettant de faire des prédictions sur la vie humaine. Il peut prédire n'importe quoi à condition de disposer de données d'entraînement», explique à l'AFP Sune Lehmann, professeur à l'Université technique du Danamerk (DTU), et l'un des auteurs de l'étude publiée dans la revue Nature Computational Science.
Selon lui, les possibilités sont infinies.
«Il pourrait prédire les résultats en matière de santé. Il pourrait donc prédire la fertilité ou l'obésité, ou peut-être qui va avoir un cancer ou pas. Mais il pourrait aussi prédire si vous allez gagner beaucoup d'argent», ajoute-t-il.
Concrètement, life2vec utilise un modèle opératoire similaire à celui de ChatGPT mais au lieu de traiter des données textuelles, il analyse les étapes de la vie telles que naissance, études, prestations sociales ou encore horaires de travail.
«D'un certain point de vue, la vie n'est qu'une suite d'événements: les gens naissent, vont chez le pédiatre, vont à l'école, déménagent, se marient, etc.», selon l'étude.
«Nous exploitons ici cette similitude pour adapter les innovations du traitement automatique du langage naturel à l'examen de l'évolution et la prévisibilité des vies humaines sur la base de séquences d'événements détaillées», précise-t-elle.
Six millions de données
Elle est basée sur les données anonymisées des quelque six millions de Danois rassemblées par l'institut national de statistiques.
L'analyse des séquences permet d'en prédire la suite jusqu'à la fin. Sur la mort, l'algorithme a raison dans 78% des cas, sur les migrations, dans 73%.
«Avec une très jeune cohorte de personnes âgées entre 35 et 65 ans, on essaie de prédire, en se fondant sur une période de huit ans – 2008 à 2016, si la personne va mourir dans les quatre ans à venir, jusqu'en 2020. Le modèle fait ça très bien, mieux que n'importe quel autre algorithme», détaille M. Lehmann, qui se garde d'utiliser sa formule sur des cas personnels.
Cette tranche d'âge, où les décès sont habituellement peu nombreux, permet, selon les chercheurs, de vérifier la fiabilité du programme.
Mais l'outil n'est pas à prêt à être utilisé par le grand public car il comporte encore des biais. «Pour le moment, c'est un projet de recherche qui explore le champ des possibles (...), on ne sait pas s'il traite tout le monde de manière égale».
Reste aussi à découvrir le rôle du temps long, des connections sociales et de leur impact sur la prédictibilité des vies.
Contrepoids scientifique
Pour l'universitaire, le projet présente un contrepoids scientifique aux algorithmes développés par les Gafam (Google, Apple, Facebook, Amazon, Microsoft).
«Ils peuvent aussi construire des modèles de ce type, mais ils ne les rendent pas publics, n'en parlent pas», dit-il. «On peut espérer qu'ils les mettent au point seulement pour nous faire acheter plus de produits», ajoute le chercheur.
Pour lui, c'est «important d'avoir un contrepoids public et ouvert pour commencer à comprendre ce qu'on peut faire avec des données de ce genre».
D'autant plus que des algorithmes de ce type sont déjà certainement utilisés dans le domaine de l'assurance, avance l'experte en éthique des données Pernille Tranberg.
«On est certainement mis dans des groupes (...) et ça peut être utilisé contre nous dans la mesure où ça peut nous obliger à payer une police d'assurance plus élevée, nous interdire un prêt à la banque ou l'accès aux soins publics car on va mourir de toutes façons», énumère-t-elle.
Des biais absents du projet de recherche, qui n'est pas destiné à une utilisation individuelle, grâce à l'anonymisation de ses sources.
«Il n'y a pas d'exemple de fuites de données» personnelles avec l'institut national de statistiques, et «les données ne sont pas individualisées», souligne-t-elle. Toutefois, avec le développement de l'intelligence artificielle, «tout s'accélère».
Le projet «montre simplement que nous avons beaucoup de données au Danemark et qu'on peut les utiliser car nous les humains allons tous dans la même direction», ajoute Mme Tranberg.
Et certains développeurs ont décidé d'exploiter l'idée à des fins commerciales.
«Sur le web, on voit déjà des horloges de prédiction, qui montrent l'âge qu'on va atteindre et certaines ne sont pas du tout fiables», prévient-elle.