Les travaux d’Antonio Casilli décrivent les micro tâches d’annotation réalisées par « les petites mains de l’IA », nécessaires au développement des applications comme ChatGPT et souvent invisibles. Nécessaires à la réalisation des prouesses spectaculaires de l’IA, elles relativisent la portée de son « intelligence » et surtout de son autonomie par rapport à un système fondé sur le travail humain peu qualifié qui entretient et exacerbe des inégalités à grande échelle.
Cette conversation est le troisième épisode de notre série « Puissances de l’IA ».
Est-ce que vous diriez que nous entrons dans une nouvelle ère pour l’IA avec les LLMs et generative AI ? Bill Gates affirme que ChatGPT va changer le monde là où Yann Le Cun soutient qu’il n’y a rien de révolutionnaire. Pensez vous que nous sommes à un point d’inflexion ? Comment voyez vous l’histoire récente de l’IA ?
Je ne raisonne pas en termes d’évolution du paradigme mais plutôt de tendances historiques et socio-économiques qui s’inscrivent dans le temps. De ce point de vue-là, les LLM nereprésentent pas un changement radical, dans la mesure où il s’agit de machine learning avec une très forte intensité de données. Ce sont des modèles qui deviennent de plus en plus hypertrophiques, avec des trillions de paramètres — pas pour ChatGPT mais pour Google Tense Flow et Alibaba par exemple. On voit la même chose depuis quinze ans.
J’analyse la société civile avec mes lunettes de sociologue mais on ne peut pas faire abstraction du fait qu’il y ait eu le choc exogène du Covid. La pandémie a été le moment de rhétorique ambiante, de discours d’accompagnement et d’éléments de langage marketing de revitalisation des marronniers et de tous les mots d’ordres qui étaient déjà là il y a dix ans. À l’époque de la première vague, on parlait de Big data, puis d’algorithmes ; maintenant, dans le langage courant, on ne parle que d’IA. La pandémie a été un moment où, à cause des restrictions de circulation des populations et des biens, on a dû recourir à des méthodes d’analyse des activités qui ne pouvaient plus se faire en présentiel. On a assisté à une floraison de solutions de mise à distance de travail. L’intelligence artificielle a été utilisée pour cela, alors qu’en réalité, dans la plupart des cas, on déléguait ces tâches à des personnes qui se trouvaient à des milliers de kilomètres de distance. Avec mon équipe, notre travail consiste depuis des années à faire le tour du monde pour retrouver les humains qui font les IA.
Le changement semble donc plutôt quantitatif, en termes de ressources, plutôt que qualitatif. Pourriez-vous décrire ce que sont les micro-tâches, indispensables à la production des modèles d’IA tels que ChatGPT aujourd’hui ?
Il y a trois types de micro-tâches : celles qui servent à réparer l’IA, celles qui vérifient l’IA et celles qui imitent l’IA. Les micro-tâches sont informatiques, réalisées par l’intermédiaire de plateformes ; elles consistent à traiter de grandes masses de données en les fragmentant et en les atomisant en petits projets. Des centaines de millions de personnes s’en sont déjà occupé dans le monde, selon les estimations de nos collègues d’Oxford.
Il y a trois types de micro-tâches : celles qui servent à réparer l’IA, celles qui vérifient l’IA et celles qui imitent l’IA.
Il s’agit, par exemple, de générer des échantillons de conversation dans une langue donnée, des images d’animaux ou de mets. Ces données ont besoin d’être enrichies par des micro-tâches qui servent à la préparation de l’intelligence artificielle pour la notation de données. Une même photo d’animaux doit être étiquetée — est-ce des chiens ? des chats ? — pour nourrir les énormes bases de données qui vont servir aux algorithmes pour réaliser l’apprentissage automatique des machines.
Il y a également les micro-tâches de vérification : par exemple, voir si la machine a bien reconnu telle langue et donc vérifier si la langue attribuée à cette conversation est la bonne. Dans ChatGPT, les testeurs-utilisateurs peuvent envoyer des prompts et sont incités à mettre des pouces levés ou baissés pour indiquer s’ils sont d’accord ou non avec le texte généré. En l’occurrence, cette micro-tâche de vérification n’est pas rémunérée, mais d’autres personnes le sont pour faire la même chose.
La troisième activité — celle qui provoque des frissons — comprend les micro-tâches d’imitation de l’intelligence artificielle. D’un certain point de vue, elles relèvent de la fraude à l’intelligence artificielle, ou de l’artificial artificial intelligence. On peut songer, plus loin dans le temps, au turc mécanique, qui était un faux joueur d’échecs automatique, sous lequel se cachait un être humain. Dans nos enquêtes, on rencontre des entreprises qui font de la fausse intelligence artificielle — parce que c’est de la fraude commerciale ou parce que cela fait partie du métier. Le groove of concept se fait souvent grâce à l’aide d’un être humain qui fait semblant d’être une intelligence artificielle. La méthode connue dite du magicien d’Oz, qui consiste à avoir deux machines qu’on connecte — l’une étant utilisée par un véritable utilisateur et l’autre faisant semblant d’être une machine — comme dans un test de Turing, existe depuis bientôt cinquante ans. C’est connu, même si cela fait toujours peur quand on le dit. On nous accuse toujours un peu d’exagérer, mais en vérité ces trois types de micro-tâches sont systématiques, y compris les tâches d’imitation. Parfois, quand la machine dysfonctionne et que l’intelligence artificielle ne marche pas, certaines personnes peuvent donner un petit coup de pouce à l’algorithme.
Ce sont ces trois types de tâches qui produisent des contributions humaines à l’activité des moteurs de recherche par intelligence artificielle. Ces tâches vont rester nécessaires tant que l’on continue à faire du machine learning. On peut aussi espérer que le paradigme change et qu’on passe à un autre paradigme d’apprentissage, qui pourrait être le grand rival de l’apprentissage symbolique — ou inventer quelque chose de complètement nouveau ; mais pour l’instant, nous sommes dans une situation caractérisée par une immense quantité de travail humain qui doit constamment être injectée pour faire fonctionner l’infrastructure de l’IA.
Nous sommes dans une situation caractérisée par une immense quantité de travail humain qui doit constamment être injectée pour faire fonctionner l’infrastructure de l’IA.
Ce travail, en apparence accessible à la plupart des personnes ayant des compétences de base, exacerbe certaines inégalités, notamment celle de genre. Pourquoi ?
D’abord, il faudrait rappeler comment on arrive à faire ce micro-travail. Si une personne voulait commencer aujourd’hui à faire du micro-travail, elle devrait d’abord savoir vers où se tourner. Il y a plusieurs manières, la plus simple étant de passer par des plateformes sur Internet. Elles ressemblent à des sites classiques d’annonces d’emplois sauf qu’il ne s’agit pas d’emplois formels. C’est du freelancing extrême parce qu’on vous recrute pendant une minute pour regarder 15 photos ou pour laisser un commentaire sur un moteur de recherche. Vous êtes payés quelques centimes, voire quelques dollars. L’inflation monte, impactant ces micro-tâches. Il y a quinze ans, elles étaient payées quelques centimes ; aujourd’hui elles commencent à être payées autour d’un dollar. Quand on fait des estimations, on voit que la médiane tourne autour de deux dollars de l’heure. Ces personnes-là ne sont pas embauchées pour travailler sous contrat, elles n’ont pas d’horaires à proprement parler, elles sont payées pendant les quelques minutes où elles travaillent.
Quelques mois après le lancement de ChatGPT, le magazine Time a découvert qu’il y avait des personnes au Kenya qui faisaient ce type de micro-tâches, et qui étaient payées entre 1,34 et 2 dollars de l’heure. Ces micro-tâches montrent un changement dans notre manière de fonctionner ; une partie de ces activités se situe en dehors de la civilisation salariale, en dehors de la protection du Code du travail.
Certaines inégalités se manifestent de manière plus forte chez les populations déjà fragilisées et marginalisées, et qui ont déjà des difficultés d’accès au marché du travail. Dans les pays plus riches du Nord, les femmes sont légèrement majoritaires parmi ceux qui travaillent sur ce type de plateforme. En France, dans notre dernière enquête de 2019, 56 % des micro-travailleurs sont des femmes. Or elles sont systématiquement celles qui gagnent le moins ; celles qui se tournent vers ce type d’activité ont besoin de compléter leur salaire principal, parce qu’elles travaillent à mi-temps. Dans notre enquête, ce sont surtout des femmes vivant seules avec un enfant. Elles doivent jongler entre leur activité principale, le micro-travail, le travail domestique et le soin des enfants. Dans ce contexte-là, elles n’ont pas de temps pour consacrer du temps à chercher les meilleures micro-tâches ou à s’entraîner ; c’est pourquoi elles sont les micro-travailleurs les moins bien payés.
Au Venezuela, le salaire moyen national avoisine les 5 dollars par mois. Si ces personnes arrivent à gagner 2 ou 3 dollars par mois, ils considèrent que c’est un bon complément.
On constate effectivement un effet de surenchère dans la discrimination économique qui s’ajoute à la discrimination de genre. Il y a d’autres types de discriminations, plus graves parce que plus larges ; par exemple, les discriminations liées à l’origine, la langue ou d’autres dimensions de l’ethnicité des personnes. On parle là d’un travail qui a tendance à créer des chaînes de sous-traitance internationale. Les pays dans lesquels on trouve des personnes disposées à travailler pour des faibles rémunérations sont des pays à bas revenus. Mon groupe d’enquêteurs a passé les dernières années entre l’Égypte, Madagascar, le Venezuela, le Chili et la Colombie, des pays dans lesquels on observe des situations très différentes. Là, en revanche, l’écrasante majorité des personnes qui sont sur ces plateformes sont des hommes.
Dans un marché du travail hyper compétitif dans lequel l’accès au travail n’est pas assuré pour tout le monde, ce sont les personnes les mieux positionnées qui cherchent le micro-travail. Certes, il comporte beaucoup de bémols, mais étant donné les niveaux de rémunération et le coût de la vie dans ces pays, cela reste un travail de qualité. À Madagascar, les micro-travailleurs arrivent à avoir un salaire de 95 euros par mois — ce qui n’est pas suffisant pour vivre dans une grande ville comme Tananarive. Au Venezuela, le salaire moyen national avoisine les 5 dollars par mois. Si ces personnes arrivent à gagner 2 ou 3 dollars par mois, ils considèrent que c’est un bon complément, d’autant plus qu’il vient d’une devise stable, à la différence du bolivar, la devise locale, qui se déprécie de jour en jour.
Pensez vous que cette précarité des travailleurs du digital labor soit liée aux efforts déployés pour cacher la dépendance de l’IA à cette main-d’œuvre — un peu comme l’opérateur du turc mécanique, caché sous le plateau d’échec ?
Je suis de moins en moins certain que l’on soit face à une situation dans laquelle un seul facteur, une seule variable impacte ce contexte, qui est quand même assez compliqué. Il y a effectivement un élément lié au type de tâche qui doit être réalisé. On a assisté dans les quinze dernières années à un changement de la manière dont est traitée l’information. Si, auparavant, on cherchait des annotateurs experts en gestion de données, c’était pour entraîner les systèmes. Avec la déferlante du machine learning, on a changé de méthode. Ce ne sont plus des experts qui doivent entraîner ces machines.
Si, auparavant, on cherchait des annotateurs experts en gestion de données, c’était pour entraîner les systèmes. Avec la déferlante du machine learning, on a changé de méthode. Ce ne sont plus des experts qui doivent entraîner ces machines.
Ces personnes sont sollicitées pour faire des annotations qui ne sont pas très sophistiquées ; c’est pourquoi on caractérise le micro-travail comme un travail peu qualifié ; mais en réalité, il est nécessaire de s’y former. C’est une formation pour exprimer sur des données des jugements qui relèvent du sens commun. Est-ce que c’est un chien ou un chat ? Est-ce que cette conversation dans ce fragment audio est celle d’une personne qui chuchote ou d’une personne qui crie ? Ce sont souvent des activités qui, parce qu’elles font appel au sens commun, ont besoin de mobiliser un groupe sur la partie centrale de la distribution : or il vous faut un échantillon important de personnes qui réalisent cette tâche pour pouvoir atteindre cette partie.
Je peux m’imaginer que le métier qui est le vôtre s’est structuré en créant de la distance par rapport aux savoirs non-experts, c’est le b.a-ba de l’histoire des professions. Toute profession, y compris la profession d’algorithmicien, de data scientist ou d’expert en intelligence artificielle doit expliquer pour inventer de la valeur que la compétence qu’elle mobilise n’est pas à la portée de tous.
Le « tous » ainsi entendu, ce sont des centaines de milliers de micro-travailleurs partout dans le monde, lesquels participent exactement au même métier, à la même chaîne de production, et sont par contre considérés comme des personnes sans qualité. Je me souviens de propos particulièrement violents tenus par un ingénieur d’IBM dans une conversation en marge d’un colloque, alors que je lui racontais qu’on étudiait le micro-travail : « ça, ce n’est rien, ce sont de petits indiens qui balaient après qu’on a fini ». Il les assimilait d’une façon très paternaliste et violente à des agents de propreté, qui font du nettoyage. C’est à mon sens quelque chose de particulièrement fort, qui contribue à l’invisibilisation relative de ce travail. Dans les pays du Nord, ces travailleurs sont invisibles car on ne les voit pas. Ils se trouvent à Madagascar, au Venezuela, en Colombie où ils travaillent dans des cybercafés, chez eux ou dans des sociétés qui ont pignon sur rue. Il y a des quartiers entiers dans la capitale de Madagascar où passe une énorme « route des hydrocarbures », un district industriel dans lequel on retrouve beaucoup d’entreprises et de plateformes qui font ce type de travail.
Les gains de productivité massif ont toujours généré des peurs, parfois irrationnelles. En 2013, Osborne et Frey ont prédit que 47 % des emplois aux États-Unis seraient détruits d’ici à 2030 par l’IA et les robots. Quel est votre point de vue ? Est-on dans un cycle schumpétérien classique de « destruction créatrice », ou dans un moment de remplacement par les robots ?
Nous sommes dans un processus de précarisation et de remplacement de personnes par d’autres moins bien protégées. Ce qu’Osborne et Frey avaient dit dans ce rapport a très vite été mis en doute, par pratiquement toute la communauté scientifique. En 2019, année de l’arrivée de la crise sanitaire, on se retrouvait dans une situation où l’emploi ne s’était pas effondré ; donc ce n’était heureusement pas en train de se réaliser. De même, aujourd’hui, avec une crise géopolitique en Europe et une crise sanitaire, nous sommes dans une situation où la perspective n’est pas d’avoir perdu d’ici sept ans 47 % des emplois.
En revanche, on voit qu’il y a deux tendances : la première est une tendance longue à l’érosion des droits et des acquis sociaux du travail. C’est un projet politique des droites conservatrices dans pratiquement tous les pays du monde. Qui dit travailleur moins bien protégé dit aussi salaire plus bas, et qui dit salaire plus bas dit qu’une partie plus importante de la valeur produite pourra aller aux investisseurs ; ces derniers sont donc déjà d’accord avec ce type de projet. L’intelligence artificielle est, de mon point de vue, non pas le cheval de Troie mais une ruse d’érosion des acquis sociaux. La finalité ultime est de discipliner le travail qui reste. Je ne nie pas que des emplois seront détruits mais un emploi détruit ne veut pas dire un robot qui se met au travail. Cela veut surtout dire 56 000 personnes qui font du micro-travail un peu partout dans le monde. C’est malheureusement quelque chose qu’on voit déjà poindre en France, même dans la fonction publique, sans parler des grandes entreprises françaises. Les promesses d’automatisation cachent des projets de micro-travail où l’on récupère du côté des investisseurs ce que l’on va sous-traiter dans d’autres pays.
Les promesses d’automatisation cachent des projets de micro-travail où l’on récupère du côté des investisseurs ce que l’on va sous-traiter dans d’autres pays.
Il y a un bémol sur lequel j’insisterais : il faut faire une différence entre robotisation et automatisation intelligente. La robotisation a pour vocation de remplacer l’effort humain. C’est le cas depuis des siècles. La réflexion autour des machines à la Renaissance et à la fin du Moyen-Âge voyait en elles un moyen de limiter l’effort humain. Les robots ont une tendance à remplacer les êtres humains qui réalisent un travail physique. En revanche, l’intelligence artificielle — et surtout l’automatisation intelligente, avec une très forte composante d’opérations à réaliser sur les données — n’a pas vocation à remplacer le travail humain. Au contraire, elle a vocation à le compléter, à l’intégrer, à l’améliorer et à le rafraîchir. De ce point de vue-là, on ne peut pas se passer des êtres humains. Les soi-disant gains de productivité promis ne sont pas au rendez-vous quand on regarde les statistiques au niveau mondial. Le taux de croissance de la productivité est au plus bas depuis ces vingt dernières années. C’est un contresens, c’est un impensé qui ne ressemble pas à un cycle schumpétérien. C’est plutôt une dégringolade ou une longue traîne après une gaussienne si l’on regarde comment l’évolution du taux de productivité s’articule à la croissance de la productivité ces dernières années.
Dans Atlas of AI, Kate Crawford pose la question de la véritable nature de la collaboration entre l’homme et la machine. Cette collaboration refléterait surtout une asymétrie de pouvoir qui ne serait pas négociée équitablement. Elle parle d’engagement forcé — on peut penser aux travailleurs des plateformes de livraison, par exemple. Comment peut-on mieux penser l’automatisation pour inclure l’humain dans la boucle au moment de la conception de ces systèmes ?
Le travail de Kate Crawford et de toutes les personnes qui l’entourent est très important, surtout parce qu’il s’agit d’une voie d’issue. Des livres comme Atlas of IA soulignent le fait que l’intelligence artificielle n’est pas seulement immatérielle. Au contraire, il s’agit d’une infrastructure globale, qui s’étale sur des dizaines de milliers de kilomètres et qui implique des centaines de millions de personnes. Elle est bien matérielle, avec des données et des algorithmes, mais aussi des batteries, du lithium, du cobalt, des terres rares et de l’étain. À mon sens, l’une des issues possibles est de réfléchir à une articulation entre la partie matérielle — les dispositifs intelligents — et la partie immatérielle — les données. Ce sont des recherches qui sont un peu plus obliques par rapport à nos activités, mais à côté de notre travail sur les travailleurs du clic, nous allons voir ce qu’il se passe dans les mines de nickel et cobalt ou dans les gisements de lithium.
L’une des issues possibles est de réfléchir à une articulation entre la partie matérielle — les dispositifs intelligents — et la partie immatérielle — les données.
Il y a une continuité entre les espaces dans lesquels les données sont produites et ceux dans lesquels cette base minérale de notre intelligence artificielle est extraite. Il faut commencer à réfléchir d’une manière plus globale à la gouvernance de ces chaînes de production. Ce n’est pas seulement une question d’utilisateurs finaux, d’utilisateurs qui se trouvent dans le Nord du monde et ont droit de parole ou de regard sur l’algorithme. Quand on est à la phase de l’algorithme, on est déjà à la fin de la chaîne. Les dégâts ont déjà eu lieu, les problèmes sont déjà survenus ailleurs, et on n’est pas certains d’être arrivés à les résoudre. Il faut remonter la chaîne et résoudre le problème sur l’ensemble de celle-ci. C’est aussi aux grandes multinationales de l’IA et de la tech de faire un effort pour respecter les lois qui existent. Il existe des textes en faveur de la responsabilité sociale et environnementale des multinationales. Les entreprises qui travaillent dans le textile, par exemple, sont responsables de ce qui se passe tout au long de la chaîne de production. Elles sont responsables du respect d’un certain nombre de standards et de lois. Pourquoi les entreprises de la tech ne seraient-elles pas soumises au même type de contraintes ? C’est la question qui reste ouverte.
Je suis prêt à imaginer des grandes utopies, un grand monde d’internationalisation, de plateformes anarchistes organisées sur un mode fédératif. Mais d’abord, faisons en sorte que les lois qui existent déjà et qui protègent effectivement les personnes qui subissent cette transformation soient respectées, et qu’on commence effectivement par limiter ce type de dégâts aujourd’hui.
Dans une note de blog, Sam Altman propose une réforme du capitalisme et de la redistribution des richesses dans un monde où l’IA produirait seule la plupart des biens et des services. Il propose de taxer les revenus du capital plutôt que ceux du travail, qui créeront moins de valeur économique au sens où on l’entend aujourd’hui — soit une taxation des entreprises à hauteur de 2,5 % de la valorisation chaque année, payable en actions et redistribuée à tous les citoyens majeurs. Comment imaginez-vous les implications politiques d’une société avec l’AI et est-ce une question raisonnable à se poser maintenant ?
L’un des points de départ pour ce type de réflexion est d’abandonner les propositions à la Altman, qui sont basées sur le présupposé erroné selon lequel on va vers un monde où l’automatisation est véritablement artificielle. Plus l’intelligence artificielle devient intelligente, moins elle est artificielle. Quand on parle de taxe robot ou de revenu de citoyenneté basé sur le fait que les gens ne travaillent plus, on se trompe d’analyse. Au contraire, il faut inventer des politiques publiques qui prennent davantage sous leur tutelle des personnes dont le travail demeure nécessaire et devient par ailleurs encore plus nécessaire aujourd’hui, du moins pour entretenir cette énorme infrastructure qu’est l’intelligence artificielle. Il faut reconnaître la nature profondément redistributive de ces mesures. Si on ne raisonne pas en termes de redistribution de la rente ou des richesses — évidemment c’est un gros mot pour un milliardaire américain — l’on va se retrouver confrontés à un problème. S’il n’y a pas de base socio-économique pour justifier ces mesures, elles seront caduques, non applicables et exacerberont les inégalités sociales pour provoquer encore plus de conflictualité. On pourrait même se dire qu’il serait souhaitable d’avoir plus de conflictualité par rapport à la situation actuelle. À mon avis, il faut commencer à réfléchir ; il faut prendre conscience que le revenu de citoyenneté doit être un revenu primaire — qui ressemble beaucoup plus au salaire à vie de Bernard Friot qu’au revenu universel d’Elon Musk.
Il faut prendre conscience que le revenu de citoyenneté doit être un revenu primaire — qui ressemble beaucoup plus au salaire à vie de Bernard Friot qu’au revenu universel d’Elon Musk.
C’est ce que j’évoque à la fin de mon livre En attendant les robots. Il s’agit vraiment de deux visions complètement incompatibles, parce que basées sur des présupposés complètement différents : d’une part, la vision Silicon Valley sous-entend que le travail disparaît et qu’il faut inventer une manière de faire de la bienfaisance, de l’effective altruism ; d’autre part, l’on a le présupposé entièrement différent selon lequel on ne peut pas se débarrasser du travail. Dans ce paradigme, les travailleurs ne disparaissent pas, il y a tout au plus des efforts pour les invisibiliser et les envoyer dans un autre continent, mais la force de travail subsiste et augmente par ailleurs, même au niveau des effectifs. Depuis le Covid-19, il y a eu une montée en flèche sur les plateformes de micro-travail du nombre des personnes inscrites et de l’activité déclarée de ces mêmes plateformes. Auparavant, elles avaient 400 000 ou 500 000 travailleurs ; elles se retrouvent maintenant avec 2 ou 3 millions d’utilisateurs. Il faut prendre ces chiffres avec des pincettes — car elles cherchent à se vanter pour appâter les investisseurs — mais cette force de travail est en train de de monter.