S’ils nous ont fait gagner du temps à une époque lointaine, les emails et fichiers bureautiques sont aujourd’hui la hantise des cols blancs, car ils en ont fait les esclaves modernes de mauvaises habitudes de travail que personne n’est parvenu jusque-là à corriger. Mais les dernières avancées en matière d’IA génératives nous laissent penser qu’il y a une lueur d’espoir et que ces centaines de millions de travailleurs du savoir pourront très prochainement déléguer à des agents intelligents le soin d’extraire les informations et données de ce flot incessant de messages et fichiers pour les réinjecter dans les applications métier. Est-ce la révolution tant attendue ? Je ne sais pas, mais j’ai vraiment hâte que ça se produise ! Et ça tombe bien, car les éditeurs espèrent bien en faire leurs prochaines vaches à lait.
En synthèse :
2025 sera une grande année, car nous fêterons à la fois les 40 ans de Windows et d’Excel ,mais également les 30 ans de l’email, du moins dans sa forme moderne : celle qui exploite des protocoles comme SMTP, IMAP ou POP3. Doit-on réellement s’en réjouir ? Plus ou moins, car si ces outils informatiques sont très clairement des piliers de notre culture professionnelle, ils sont également les responsables de plusieurs décennies de gestion chaotique de messages et fichiers, ainsi que d’innombrables saisies et traitements manuels des données (avec tout ce que cela implique de perte de temps et d’erreurs). Donc il n’y a pas vraiment de quoi se réjouir.
Ceci étant dit, accuser ces outils ne raconte qu’une partie de l’histoire, car les vrais responsables de la gestion catastrophique des fichiers et messages sont les utilisateurs eux-mêmes. Quoique pas tout à fait, car il faut bien reconnaître qu’ils sont livrés à eux-mêmes face à des outils qu’ils ne maîtrisent pas forcément.
Au final, peu importe qui est responsable de quoi, car la situation est aujourd’hui très problématique avec une très grande partie de l’information, de la connaissance et des données qui se retrouvent éparpillées, inaccessibles pour les collègues ou les outils métier sans une intervention humaine. Formulé autrement : seuls les humains sont capables de traiter ce mélange d’informations et données non-structurées.
Des salariés devenus esclaves des pièces jointes
Que vous en soyez conscient ou pas, que vous l’acceptiez ou pas, ce fait est irréfutable : les employés de bureau sont devenus les esclaves des pièces jointes : tels Sisyphe et son rocher, ils collectent inlassablement les informations et pièces jointes des emails et fichiers bureautiques pour les ressaisir dans l’ERP.
Microsoft et Google ont bien essayé de s’attaquer à ce problème en tentant d’indexer tous ces messages et fichiers pour extraire et structurer les informations qui sont piégées à l’intérieur (via Outlook / SharePoint et Mail / Search Desktop), mais sans succès…
Autant les grandes entreprises tentent de résoudre l’éparpillement des informations avec le déploiement de digital workplaces, ainsi que la prolifération des données avec des référentiels et des outils de gouvernance de la donnée (« Master data management » en anglais), mais les plus petites structures ne bénéficient pas des gros moyens et se retrouvent face à une situation de blocage. Ainsi, d’innombrables employés de bureau de PME et TPE et assimilés perdent un temps fou à extraire les informations et données des emails et fichiers Word / Excel / PDF / … pour les saisir à nouveau dans les formulaires de leurs applications métier.
N’allez pas penser que je suis plus malin que les autres, car je suis le premier à subir cette situation, notamment avec mes clients pour lesquels je commence généralement par rédiger une proposition de démarche, qui si elle est acceptée doit être formalisée dans un devis (première ressaisie), qui est transformé par le client en bon de commande (deuxième ressaisie), que je dois transformer en fin de mission en facture (troisième ressaisie).
Vous pourriez me dire qu’il existe des applications en ligne de gestion des devis et factures, mais ils ne permettent pas de rédiger des propositions de démarche détaillées et ne sont de toute façon jamais compatibles avec les ERP de mes clients qui ne savent que cracher des bons de commande en PDF qui sont envoyés par email. C’est triste à dire, mais nous sommes tous des esclaves d’un écosystème de messages et fichiers que plus personne ne parvient à maîtriser.
À moins que les choses ne puissent enfin changer grâce aux modèles génératifs…
L’IA comme remède à l’éparpillement des informations et données
Croyez-le ou non, mais il se pourrait que nous soyons à l’aube d’une révolution qui va bouleverser notre quotidien professionnel. Inutile d’aller farfouiller dans les dernières publications scientifiques sur Axiv ou de vous farcir les interminables rapports des cabinets conseil ou sociétés d’investissement, le véritable levier d’adoption de l’IA générative à court terme ne sera pas technologique, mais fonctionnel avec des cas d’usage très pragmatiques comme l’extraction et le routage d’informations et données.
Si 2024 a été l’année des chatbots (ChatGPT, Claude, Perplexity…), 2025 sera l’année des agents intelligents grâce à leur capacité à justement soulager les collaborateurs de ces innombrables tâches à faible valeur ajoutée. Par exemple, le routage du flot incessant de messages entrant dans n’importe quelle entreprise (emails, formulaires, appels…) avec un principe de qualification / priorisation des demandes et d’extraction / importation des informations et données dans les bonnes applications.
C’est une promesse qui n’est pas récente, mais les progrès réalisés par les modèles génératifs nous donnent bon espoir sur la capacité des agents intelligents à pouvoir identifier, extraire, nettoyer et structurer toutes ces informations et données. Certes, les modèles actuels ne sont pas capables de le faire nativement, mais de nombreuses solutions reposant sur ces modèles commencent à voir le jour : The Messy Inbox Problem: Wedge Strategies in AI Apps.
L’idée maîtresse n’est pas de fantasmer sur une IA généraliste omnisciente et omnipotente, mais sur des agents intelligents spécifiquement conçus pour traiter les messages et documents d’un secteur d’activité (selon ses spécificités) et de pouvoir automatiser l’extraction / importation des données dans des applications informatiques verticales. C’est le cas de plusieurs solutions citées dans l’article comme Tennr pour les informations médicales, Hero Data pour les prêts aux PME pour ou Eve dans le juridique.
Ceci étant dit, le principe d’un agent de recherche / extraction généraliste ne relève pas non plus du fantasme s’il est envisagé au sein d’un environnement numérique de travail intégré comme ceux de Microsoft (Outlook + SharePoint + Teams), Google (Workspace) ou même Notion dont l’offre s’étoffe de mois en mois (Here is Notion’s email client).
Mais nous ne sommes malheureusement pas dans un monde parfait, et toute entreprise avec un minimum d’ancienneté (comme c’est souvent le cas) doit composer avec un système d’information « Frankenstein » composé de nombreuses couches et applications disparates. Soit, il ne nous reste plus qu’à entraîner des agents intelligents pour qu’ils aillent récupérer ces informations et données comme nous le ferions avec un stagiaire.
Les agents intelligents seront vos meilleurs stagiaires
Est-il illusoire de penser qu’à court terme, nous pourrions disposer d’agents intelligents capables de fouiller dans nos messages et fichiers pour aller extraire la bonne information ou donnée ? Non, car c’est ce que sont en train de finaliser les éditeurs d’IA générative, à commencer par Anthropic, l’éditeur du chatbot Claude, qui vient de dévoiler un tout nouveau modèle de vision capable d’apprendre des interactions d’un utilisateur avec son ordinateur et d’en prendre le contrôle pour effectuer des tâches simples à sa place : Anthropic’s new AI model can control your PC.
Ici une démonstration en vidéo :
Vous pourriez, à juste titre, penser que c’est une nouvelle tentative d’une startup de nous faire croire qu’ils maîtrisent une technologie qu’ils ne maîtrisent en fait pas réellement (sur le principe du « Fake it until you make it« ), mais ils ne sont pas les seuls puisque Microsoft avait déjà présenté un modèle similaire l’année dernière : A UI-Focused Agent for Windows OS Interaction.
Et ce n’est pas tout, car nous venons également d’apprendre que Google travaille sur un agent similaire capable de reproduire les gestes et des utilisateurs et d’accomplir des tâches de premier niveau : Google is reportedly developing a ‘computer-using agent’ AI system. Là où ça devient carrément intéressant, c’est que la rumeur court qu’ils pourraient très prochainement intégrer cet agent à leur navigateur pour qu’il puisse réserver un billet de train ou faire les courses à votre place : Google preps ‘Jarvis’ AI agent that works in Chrome.
L’idée à de quoi surprendre, et même d’inquiéter les techno-réfractaires, mais dans l’absolu, en quoi est-ce très différent des services de conciergerie mobiles qui existaient il y a une dizaine d’années et qui proposaient de déléguer à un opérateur humain des tâches à faible valeur ajoutée en envoyant un simple SMS ? (cf. Des services de conciergerie mobiles aux applications transparentes). Le principe est le même : faire faire une tâche à un opérateur externe, sauf qu’il ne serait pas humain, mais synthétique.
Mais cessons de regarder vers le passé et revenons à des usages beaucoup plus terre-à-terre et surtout à des besoins immédiats avec l’automatisation du traitement des informations et données (recherche, extraction, structuration, importation).
Le retour de la revanche de l’automation
Les lecteurs avertis pourraient me dire que tout ceci n’a rien de nouveau, car le principe d’automation existe depuis de nombreuses années avec des solutions qui sont de plus en plus simples à exploiter comme Power Automate de Microsoft ou Zapier, mais leur prise en main restait tout de même réservée à une élite : celle des utilisateurs particulièrement à l’aise avec les outils numériques.
Grâce aux capacités accrues des chatbots à comprendre les demandes formulées en langage naturel, nous pouvons envisager une nouvelle ère de l’automation avec des collaborateurs qui seraient assistés d’un ensemble d’agents qu’ils programmeraient pour leur déléguer des tâches répétitives. C’est en tout cas la promesse formulée par Microsoft, Linkedin ou Asana qui ont déjà lancé leur offre : New autonomous agents scale your team like never before, Introducing Hiring Assistant to help recruiters spend more time on their most impactful work et No-Code Builder for Designing and Deploying AI Agents in Critical Workflows.
À la clé : la possibilité pour ces éditeurs de définitivement verrouiller les utilisateurs au sein d’environnements numériques de travail où informations et données sont structurées selon un schéma que seule l’IA maîtrise, assurant à ces éditeurs des revenus récurrents ad vitam aeternam.
Autant j’ai été très critique ces derniers mois sur les visions utopiques d’IA généralistes capables de répondre à tous nos besoins, autant je suis carrément enthousiaste à l’idée de disposer très prochainement de solutions me permettant de créer des agents auxquels je délèguerai le soin d’extraire les informations des messages et fichiers pour les importer dans les bons outils.
Pas de quoi achever la quatrième révolution industrielle, mais assurément un moyen pragmatique pour nous faire gagner 15 à 30 minutes par jour, un authentique luxe en cette période où le temps se contracte et où nous arrivons à la limite des messageries et outils bureautiques.
Dans tous les cas de figure, une promesse dont je suis persuadé qu’elle est réalisable à court terme et qui me fait envisager le déploiement de l’IA générative à grande échelle de façon beaucoup plus sereine : un message ou fichier traité de façon automatique à la fois.