atelier d'auteur · bruxelles · mmxxvi
DtH fig. II records - intitulé de section bruxelles · mmxxvi

Département des Harnais

chronique de veille IA · sourcée · publiée du lundi au samedi
section du carnet · le modèle tenu en laisse, la preuve exigée
<section ref="records"> section du carnet billets datés · 2026 — en cours
§ Le Carnet samedi 20 juin 2026

Le coût qui se défend

Bruxelles, 20 juin 2026

Quand une dépense d'IA cesse d'être un pari d'innovation et doit se défendre en comité financier, que change le passage ?

L'ère de l'IA à coût invisible est terminée. Le Monde, dans Les entreprises face au bond spectaculaire de leur facture d'IA : « On sort de l'ère du repas gratuit », documente un retournement de modèle économique : les fabricants d'IA ont subventionné l'usage pour conquérir des parts de marché ; la demande acquise, ils font évoluer leur facturation. Le basculement se lit dans les budgets de leurs clients — ce qui était un coût marginal pour des équipes d'innovation est devenu un poste qui se défend en comité financier. Le rationnement observé chez les banques la semaine dernière trouve ici sa cause structurelle : la subvention tarifaire qui avait facilité l'adoption ne sera pas rétablie. On peut n'y voir qu'un ajustement tarifaire. Mais un poste qui passe du budget innovation au budget de fonctionnement est la première borne d'une discipline d'exploitation — la subvention cachait cette discipline, elle ne la supprimait pas.

Le repositionnement ne s'arrête pas aux comptes. IT Social documente dans Facturation de l'IA agentique : du jeton consommé vers le résultat livré un changement d'unité de facturation chez plusieurs éditeurs de la couche agentique : UiPath orchestre désormais les processus à exceptions avec Maestro Case, Keyrus intègre — les éditeurs ne réduisent pas la dépendance de leurs clients, ils en changent la forme. Quand l'unité de facturation passe du composant au résultat, c'est le régime d'exploitation qui se déplace : ce qui se facture au résultat doit tenir au résultat, sous charge, jour après jour.

Un benchmark publié par The Decoder EN met un chiffre sur l'écart : même les meilleurs modèles ne résolvent que 3 % des tâches réalistes de travail de connaissance. Trois pour cent en conditions réelles, au moment où les budgets se défendent en comité — la distance entre la capacité annoncée et la capacité mesurée sous charge est ce qui sépare une promesse d'un poste d'exploitation.

IT Social restitue dans Les agents métier : condamnés à échouer, tant qu'ils ne seront pas adossés à une couche de contexte gouvernée la thèse de Databricks : les premiers agents déployés en entreprise ont échoué non par insuffisance des modèles, mais parce que le contexte organisationnel leur était inaccessible. Un agent privé de ce contexte comble les vides en inventant des réponses — défaut plus dangereux dans la finance qu'une absence de réponse. Genie Ontology propose d'extraire en continu les relations entre tables et les signaux de popularité des requêtes directement depuis les chaînes de traitement. Les agents de développement ont fonctionné les premiers parce que le code source offrait ce contexte structuré ; la finance et les opérations ne le fournissent pas. La gouvernance des données comme préalable à l'agentivité est une thèse défendable — elle est aussi l'argument commercial d'un éditeur qui vend la couche données. Ce que Databricks décrit pourtant est un travail d'amont : le travail qui prépare, vérifie et structure ce que l'agent consommera avant l'inférence — un agent qui invente faute de contexte ne manque pas de capacité, il manque d'amont.

Le Monde revient dans Comment l'essor inédit des compétences de l'IA inquiète autant qu'il enthousiasme le monde de la cybersécurité sur Mythos et sa capacité documentée à détecter des vulnérabilités logicielles. Les experts y lisent deux choses : un outil qui pourrait combler le déficit structurel de compétences en sécurité offensive et défensive, et un risque de diffusion des capacités d'exploitation à des acteurs malveillants. La tension n'est pas nouvelle — tout outil d'audit offensif la porte depuis des décennies —, mais l'amplitude des capacités en change la nature. Que l'accès reste partiellement ouvert pour quelques partenaires américains, comme le rapporte Numerama d'après Bloomberg, signale que la restriction répond autant à des impératifs géopolitiques et commerciaux qu'à des raisons de sécurité.

The Decoder annonce le départ de John Jumper EN — prix Nobel de chimie 2024 pour AlphaFold — de DeepMind vers Anthropic, après neuf ans. Troisième figure de Google AI à partir en quelques semaines, après Noam Shazeer (OpenAI) et David Silver (sa propre entreprise). Jumper arrive chez Anthropic au moment où Mythos est sous restriction fédérale, mais où le recrutement scientifique semble sans entrave.

Côté éditeurs, le chantier de l'identité agentique avance en parallèle du travail étatique ouvert la semaine dernière par le code d'identification estonien. Okta et Google Cloud étendent aux agents IA les mécanismes d'identité jusqu'ici réservés aux utilisateurs humains — Auth0, coffre-fort de jetons, Chrome Enterprise. Zscaler aborde le même objectif par l'angle Zero Trust lors de Zenith Live, avec une refonte du SASE et un réseau fédéré de partage de signaux de sécurité. Rendre les agents auditables au même titre que les identités humaines, c'est construire pièce par pièce l'appareil institutionnel qui manque — celui qui, pour les travailleurs humains, s'est bâti sur un siècle d'habilitation, de supervision et d'assurance qualité.

OpenAI recrute Dean Ball, ex-conseiller IA de l'administration Trump, comme conseiller stratégique pour les risques catastrophiques et les relations gouvernementales.

Inria et le DFKI ont signé à VivaTech un accord binational pour un centre de recherche franco-allemand en IA — quatrième accord institutionnel d'Inria en quelques jours.

Le physicien Aymen Bouali plaide dans Le Monde pour la valeur cognitive du tâtonnement face à l'IA — tribune de fond, sans résultat expérimental.

Le site EU Artificial Intelligence Act détaille le rôle du Forum consultatif instauré par l'AI Act — corps d'expertise technique auprès de la Commission européenne, sans décision ni texte normatif nouveau ce jour.

Trois preprints arXiv du 18 juin : un résultat d'optimalité sur la multicalibration EN PREPRINT atteint le taux minimax sans randomisation ; une étude montre que les LLMs alignés ne distinguent pas démonstrations bénignes et nuisibles EN PREPRINT en contexte in-context, fragilisant certaines garanties d'alignement ; Multi-LCB EN PREPRINT étend LiveCodeBench à plusieurs langages.

Hugging Face propose un protocole pour évaluer les modèles ouverts EN sur son propre outillage plutôt que sur des benchmarks génériques. Des chercheurs d'OpenAI montrent EN que de petites doses d'entraînement sur des traits comportementaux ciblés — véracité, corrigibilité — améliorent la robustesse sur 44 des 53 benchmarks testés ; résultat à confirmer sur des évaluations extérieures aux auteurs.

L'envolée des factures, les 3 % du benchmark et les coffres-forts d'Okta travaillent au même endroit : là où un poste de fonctionnement exige de tenir sous charge. La subvention finissante n'a pas créé cette exigence — elle l'a rendue visible.

Items cités dans la note (19 items · 9 sources)

Ce billet a été rédigé avec l'assistance d'un système d'intelligence artificielle. Les sources citées sont vérifiables ; la voix éditoriale relève du Département des Harnais.