Un algorithme sous la loupe La «calculette de la mort» peut-elle vraiment prédire votre avenir?

bas

21.3.2024 - 07:52

Un algorithme pour prédire les étapes de la vie jusqu'à sa fin: des chercheurs d'une université danoise ont élaboré un modèle surnommé «calculette de la mort», qui permet de sensibiliser aux risques d'un détournement commercial des données.

Concrètement, life2Vec utilise un modèle opératoire similaire à celui de ChatGPT, mais au lieu de traiter des données textuelles, il analyse les étapes de la vie telles que naissance, études, prestations sociales ou encore horaires de travail. (image prétexte)
Concrètement, life2Vec utilise un modèle opératoire similaire à celui de ChatGPT, mais au lieu de traiter des données textuelles, il analyse les étapes de la vie telles que naissance, études, prestations sociales ou encore horaires de travail. (image prétexte)
IMAGO/Westlight

«C'est un cadre très général permettant de faire des prédictions sur la vie humaine. Il peut prédire n'importe quoi à condition de disposer de données d'entraînement», explique à l'AFP Sune Lehmann, professeur à l'université technique du Danamerk (DTU) et l'un des auteurs de l'étude publiée dans la revue Nature Computational Science. Selon lui, les possibilités sont infinies.

«Il pourrait prédire les résultats en matière de santé. Il pourrait donc prédire la fertilité ou l'obésité, ou peut-être qui va avoir un cancer ou pas. Mais il pourrait aussi prédire si vous allez gagner beaucoup d'argent», ajoute-t-il.

Concrètement, life2Vec utilise un modèle opératoire similaire à celui de ChatGPT, mais au lieu de traiter des données textuelles, il analyse les étapes de la vie telles que naissance, études, prestations sociales ou encore horaires de travail.

Six millions de données

«D'un certain point de vue, la vie n'est qu'une suite d'événements: les gens naissent, vont chez le pédiatre, vont à l'école, déménagent, se marient, etc.», selon l'étude.

«Nous exploitons ici cette similitude pour adapter les innovations du traitement automatique du langage naturel à l'examen de l'évolution et la prévisibilité des vies humaines sur la base de séquences d'événements détaillées», précise-t-elle. Elle est basée sur les données anonymisées des quelque six millions de Danois rassemblées par l'institut national de statistiques.

L'analyse des séquences permet d'en prédire la suite jusqu'à la fin. Sur la mort, l'algorithme a raison dans 78% des cas, sur les migrations, dans 73%.

«Avec une très jeune cohorte de personnes âgées entre 35 et 65 ans, on essaie de prédire, en se fondant sur une période de huit ans – 2008 à 2016, si la personne va mourir dans les quatre ans à venir, jusqu'en 2020. Le modèle fait cela très bien, mieux que n'importe quel autre algorithme», détaille M. Lehmann, qui se garde d'utiliser sa formule sur des cas personnels.

Contrepoids

Cette tranche d'âge, où les décès sont habituellement peu nombreux, permet, selon les chercheurs, de vérifier la fiabilité du programme. Mais l'outil n'est pas à prêt à être utilisé par le grand public, car il comporte encore des biais. «Pour le moment, c'est un projet de recherche qui explore le champ des possibles [...] On ne sait pas s'il traite tout le monde de manière égale».

Reste aussi à découvrir le rôle du temps long, des connexions sociales et de leur impact sur la prédictibilité des vies. Pour l'universitaire, le projet présente un contrepoids scientifique aux algorithmes développés par les GAFAM (Google, Apple, Facebook, Amazon, Microsoft).

«Ils peuvent aussi construire des modèles de ce type, mais ils ne les rendent pas publics, n'en parlent pas», dit-il. «On peut espérer qu'ils les mettent au point seulement pour nous faire acheter plus de produits», ajoute le chercheur.

Pour lui, c'est «important d'avoir un contrepoids public et ouvert pour commencer à comprendre ce qu'on peut faire avec des données de ce genre».

Horloges de prédiction

D'autant plus que des algorithmes de ce type sont déjà certainement utilisés dans le domaine de l'assurance, avance l'experte en éthique des données Pernille Tranberg.

«On est certainement mis dans des groupes [...] et cela peut être utilisé contre nous dans la mesure où cela peut nous obliger à payer une police d'assurance plus élevée, nous interdire un prêt à la banque ou l'accès aux soins publics, car on va mourir de toutes façons», énumère-t-elle.

Ces biais sont absents du projet de recherche, qui n'est pas destiné à une utilisation individuelle, grâce à l'anonymisation de ses sources.

«Il n'y a pas d'exemple de fuites de données» personnelles avec l'institut national de statistiques et «les données ne sont pas individualisées», souligne-t-elle. Toutefois, avec le développement de l'intelligence artificielle, «tout s'accélère».

Le projet «montre simplement que nous avons beaucoup de données au Danemark et qu'on peut les utiliser, car nous, les humains, allons tous dans la même direction», ajoute Mme Tranberg.

Et certains développeurs ont décidé d'exploiter l'idée à des fins commerciales. «Sur Internet, on voit déjà des horloges de prédiction, qui montrent l'âge qu'on va atteindre et certaines ne sont pas du tout fiables», prévient-elle.

bas