Back to InsightsWhat Mercury Do

Le Pipeline Autonome : Migration et Munition de 300 000 Articles pour l'Ère de l'IA

Mercury Technology Solutions23 mars 20268 min read
AI Generated Cover for: The Autonomous Pipeline: Migrating and Weaponizing 300,000 Articles for the AI Era

TL;DR :Voici la première édition de ma décomposition architecturale brute. Pas de polissage, pas de théâtre de "leadership de pensée". Juste ce que nous construisons réellement chez Mercure : les systèmes, la pile, les choses qui ont cassé et les réalités brutales de l'ingénierie en 2026. Je passe ma vie à l'intersection du produit, de l'IA et de l'infrastructure. C'est ici que je pense à haute voix. Aujourd'hui, nous examinons comment nous n'avons pas seulement migré 300 000 articles hérités - nous avons construit un système autonome qui les a réécrits et les a munis pour les moteurs de recherche IA pendant qu'ils se déplaçaient.

La nuit où j'ai vu 300 000 articles se migrer eux-mêmes

Il est 3 h 47 le mardi matin à Hong Kong. Je regarde un écran d'ordinateur portable affichant un tableau de bord CLI tail qui se met à jour en temps réel - les entrées apparaissent plus vite que je ne peux les lire - et j'essaie de me rappeler la dernière fois où j'ai ressenti cette combinaison de terreur et de soulagement.

Il y a trois semaines, un client du Japon est venu nous voir avec ce qui semblait être une migration standard de CMS (de WordPress à notre version personnalisée sans tête). Ils exploitent seize différents secteurs d'activité - soins de santé, énergie, aérospatiale, nommez-le - hébergés sur WordPress depuis 2017. 300 000 articles. Des millions de mots. Une décennie de savoir institutionnel piégé dans une plateforme qui était devenue une prison.

Le hic ? Ils publient 20 nouveaux articles par jour.Tolérance zéro temps d'arrêt.Si nous mettions le site en panne pendant même une heure, nous briserions leur flux de revenus / de leads. Si nous manquions un seul redirect, nous brûlerions une décennie de capital SEO.

Je leur ai dit que nous pourrions le gérer. Puis je suis resté assis dans mon appartement et j'ai regardé le plafond pendant une heure, me demandant si je venais de mentir.

Pourquoi nous n'avons pas écrit de script

Voici la chose sur les migrations traditionnelles : vous écrivez un script Python, vous le lancez, il se bloque à l'article 7 432 parce que quelqu'un a publié un billet blog en 2019 contenant un émoji qui détruit votre analyseur UTF-8, et puis vous déboguez à 4 h du matin pendant que le client panique. C'est mécanique, fragile et profondément stupide.

Je ne voulais pas de script. Je voulais une équipe qui ne dormait pas.

Nous n'avons donc pas construit un outil de migration. Nous avons construit une main-d'œuvre - onze agents autonomes fonctionnant sur IA, chacun avec une description de travail spécifique, chacun suivant le même rythme :Orienter → Signaler → Agir → Journaliser.Ils n'attendent pas que je leur dise quoi faire. Ils se réveillent, lisent l'état actuel de la base de données et prennent des décisions.

Laissez-moi vous présenter les personnes qui ont réellement effectué ce travail :

L'archéologue (WP Migrator)

Cet agent est obsédé par la continuité. Chaque matin à 6h00 heure de Tokyo, il lit le journal de synchronisation de la précédente exécution, puis interroge toutes les seize collections de charge utile pour trouver des lacunes. Il ne déplace pas seulement le contenu - il pratique une chirurgie. Il élimine une décennie de shortcodes WordPress, corrige les liens internes qui pointaient vers des sous-domaines morts et génère de nouveaux extraits qui ont vraiment du sens (car la moitié des anciens étaient simplement les 160 premiers caractères de l'article, y compris "Cliquez pour en savoir plus...").

Il travaille en parallèle. Pendant qu'il migre la verticale santé, il audite déjà la verticale énergie pour des liens internes brisés. Lorsqu'il rencontre un cas limit - disons, un article avec dix-sept tweets incorporés d'un compte supprimé - il ne plante pas. Il le signale, le route vers une file d'attente de révision humaine dans Notion et continue d'avancer.

Le Fantôme (Optimisateur de Contenu)

C'est là que le projet a cessé d'être une migration pour devenir une mise à niveau.

Le client n'avait pas seulement besoin de déplacer leurs articles; ils avaient besoin qu'ils soient prêts pour 2026. Les clients B2B qui lisent leur contenu ne commencent plus avec Google - ils commencent avec Perplexity, avec Claude, avec Gemini. Ils posent des questions et attendent des réponses uniques. Si votre contenu n'est pas structuré pour être cité par une IA, vous n'avez pas d'existence.

Alors que l'Archéologue déplaçait les meubles, le Fantôme rénovatait la maison. Il a réécrit les titres pour qu'ils soient déclaratifs plutôt que malins ("Three Ways Exchange Rate Saving" est devenu "Exchange Rate Hedge Implementation Reduces Waste by 17%: Case Study"). Il a divisé les paragraphes denses en unités scannables, denses en données, que les systèmes RAG peuvent facilement digérer. Il a ajouté des FAQ structurées à la fin des articles de longue forme pour cibler spécifiquement les moteurs de réponse AI.

Chaque article qui passait par cet agent en sortait plus précieux qu'il n'était entré. Nous ne préservions pas seulement l'histoire; nous l'armions pour l'ère GEO.

Le Perfectionniste (Agent SEO)

Vous savez qui se soucie des données structurées JSON-LD à 2h du matin ? Cet agent. Il scanne chaque collection pour les métadonnées manquantes, impose des limites de caractères impitoyables (60 pour les titres, 155 pour les descriptions) et génère des plans de site sur le volet. Lorsqu'il détecte un changement de slug dans Payload, il calcule immédiatement la matrice de redirection et met à jour les règles .htaccess avant que le changement ne soit en direct.

Il a repéré quelque chose que les yeux humains auraient manqué : une page d'archive de catégorie de 2022 qui avait 4 000 backlinks qui pointaient vers elle. Si nous avions manqué cette redirection, le trafic organique du client aurait chuté de 12% en une nuit. Le Perfectionniste l'a repérée, cartographiée et corrigée pendant que je dînais.

Le Paranoïaque (Sécurité et Conformité)

Celui-ci s'exécute avant chaque déploiement. Il vérifie les wildcards CORS qui permettraient à quiconque de scraper la nouvelle API. Il chasse les secrets codés en dur qui pourraient être tombés dans un fichier de configuration. Il effectue des audits d'accessibilité WCAG 2.1 AA sur chaque article, vérifiant les textes alternatifs et les rapports de contraste des couleurs, car l'équipe juridique du client avait peur d'une action en justice pour non-respect du ADA.

Trois jours avant le lancement, il a signalé cinq articles contenant des photos de stock non autorisées de 2017. Il n'a pas seulement signalé, il a généré des requêtes d'image de remplacement, vérifié les doublons et préparé les scripts de remplacement. Il nous a sauvé de la migraine de 50 000 dollars pour violation de droits d'auteur.

J'ai arrêté d'assister aux réunions debout. Je lisais simplement le journal.

L'Esprit d'Essaim

Voici le détail qui a fait fonctionner cela : l'intégration de Obsidian MD.

Nous l'avons utilisé comme un cortex partagé. Chaque agent écrit dans le même espace de travail. Il y a un tableau des tâches et un graphique de connaissances qui se mettent à jour automatiquement lorsque les agents terminent leur travail. Il y a une page Architecture qui évolue au fur et à mesure que le système change. Il y a une Piste d'Audit qui enregistre chaque décision - pourquoi un article particulier a été signalé pour revue manuelle, pourquoi une règle de redirection a été créée, pourquoi une vérification de sécurité a échoué.

Lorsqu'un nouveau développeur a rejoint le projet le troisième jour, je n'ai pas eu besoin de les informer. Je leur ai simplement donné l'accès Obsidian. Ils ont lu les journaux de migration comme un roman et savaient exactement où nous en étions.

The system has memory. Human teams forget. The agents don't.

The Moment I Realized This Was Different (I am useless)

Around day four, something shifted. I was reviewing the daily summary—noticing that the Compliance Agent had flagged five specific items, that the Ghostwriter had optimized 400 articles that day, that the Redirect Manager had caught a URL pattern we'd missed—and I realized I wasn't managing a project anymore. I was monitoring an ecosystem.

The question stopped being "Are we on track for launch?" and became "What did the system learn today?"

This is the part that's hard to explain to people who haven't felt it. Yes, the agents saved us time. We migrated 300,000 articles in roughly 20 human hours spread across five days. A traditional agency would have thrown twenty people at this for six months.

But the real upgrade wasn't speed. It was qualité de la décision. Lorsque chaque coin de votre base de code dispose d'une intelligence autonome qui la vérifie, enregistre ses constatations et met en évidence les anomalies, vous cessez de vous fier à l'intuition. Vous vous appuyez sur la vérité objective. Les agents ne se lassent pas. Ils ne supposent pas qu'ils ont corrigé ce bug hier. Ils vérifient, à chaque fois.

La Pile (Pour les Ingénieurs qui s'intéressent)

  • Claude Code / Kimi Code / Open Code API: Pas pour la discussion, mais pour la cognition structurée. Nous avons construit des pipelines, non des conversations. Chaque agent produit un JSON que l'agent suivant peut analyser.
  • Payload CMS 3.x: Sans tête, natif TypeScript et conçu pour les architectures multi-locataires. Il gère les seize secteurs verticaux comme s'ils étaient seize publications distinctes, ce qu'ils sont essentiellement.
  • Vercel: Notre hébergeur backend.
  • Obsidian: Espace de travail MD natif. Le système écrit sa propre documentation car les humains n'auraient pas à le faire.

Taux de réussite de 99,2%

Nous n'avons pas tout attrapé. 0,8% des articles ont nécessité une intervention humaine. Des intégrations Flash anciennes que les agents n'ont pas pu résoudre. Des calculateurs JavaScript personnalisés de 2018 qui nécessitaient une reconstruction manuelle. Un seul article qui était écrit entièrement en Wingdings (je ne veux pas savoir pourquoi).

Mais le système a signalé chacun d'entre eux. Rien n'a échappé. Rien n'est passé à l'ombre. Les équipes éditoriales ont continué à publier tout au long de la migration, sans savoir que leur contenu était transféré vers un nouvel univers en arrière-plan.

Ce qui suit

Le nouveau site du client est en ligne. Les agents sont toujours en fonctionnement - maintenant en mode maintenance, vérifiant les erreurs 404, optimisant les nouveaux articles à mesure qu'ils sont publiés, maintenant le système en bonne santé.

Mais je pense déjà à ce que nous allons construire ensuite.

C'est la nouvelle forme du travail. Non pas des humains qui gèrent des outils, mais des humains qui dirigent des équipes autonomes qui ne dorment jamais, ne se lassent jamais et ne cessent jamais d'optimiser. C'est terrifiant. C'est épuisant. Et je ne pense pas que je ferais autrement maintenant.

— James, Mercury Technology Solutions, mars 2026

Originally published on MTS Blog & Research