Récapitulatif de Microsoft Ignite 2025: L'essor de l'IA agentique et des outils intelligents

Chris Bardon
Publié le :
December 10, 2025
Microsoft Ignite 2025 a eu lieu le mois dernier à San Francisco, et bien qu'il y ait eu des thèmes similaires à ceux de l'année dernière, il y avait un peu plus d'étendue d'application qu'en 2024. Si l'année dernière à Chicago a marqué le premier vrai moment de « retour des conférences en personne » depuis 2020, cette année a enfoncé le clou avec encore plus de participants que le dernier événement.

Je n'ai pas assisté à une conférence au Moscone Center depuis la dernière Microsoft Build qui s'y est tenue en 2016, mais cet événement comptait beaucoup plus de participants et était soumis à une sécurité physique bien plus stricte que toutes les conférences Microsoft précédentes dont je me souvienne.  

Comme prévu, cette année était encore entièrement consacrée à l'IA, mais à un type d'IA très spécifique.  

Comprendre l'IA moderne

Le terme « IA » est un peu lourd de sens ces jours-ci, mais en général, l'IA est devenue inextricablement liée aux grands modèles linguistiques (LLM) et aux complétions de texte en langage naturel (ou d'images, de vidéos, etc.). Avant Ignite, je me demandais si j'avais manqué quelque chose sur le fonctionnement de l'IA générative moderne. On parlait tellement de la puissance de l'IA générative et des systèmes agentiques que j'ai commencé à douter de ma compréhension du fonctionnement de ce tour de magie.  

La beauté d'une conférence comme celle-ci est que l'on peut interagir avec des personnes très intelligentes, et j'ai eu l'occasion de discuter avec Mark Russinovich, le CTO d'Azure, qui est, dans l'ensemble, une personne très brillante. Je lui ai demandé sans détour si je manquais quelque chose, et il a confirmé que non. L'IA moderne se résume vraiment à ces trois éléments:

  • Prédiction de jetons : Étant donné une série de jetons, quel est le jeton suivant dans la séquence? Par exemple, donnez à un LLM « nous finissons les... » et il prédira le mot suivant comme « sandwichs » (peut-être, en gardant à l'esprit que tout cela est probabiliste).
  • Génération augmentée par récupération : Au lieu de réentraîner un modèle, la génération augmentée par récupération fonctionne en fournissant au modèle linguistique du matériel de référence supplémentaire, comme si on lui donnait un manuel et qu'on lui demandait d'y trouver la réponse. Le modèle linguistique utilise ces informations récupérées pour guider ses réponses, façonnant la sortie en fonction du contexte ajouté.
  • Appels d'outils : Conventions de messages qui renvoient des messages formatés pouvant être utilisés pour invoquer un outil spécifique. Il peut s'agir d'exécuter un morceau de code, de créer un ticket SQL ou même simplement de renvoyer l'heure actuelle. Un appel d'outil combine la prédiction de jetons et la RAG pour générer un ensemble spécial de jetons qui représente quelque chose qu'un système d'enregistrement peut traiter.  

C'est vraiment tout. Un modèle linguistique peut prédire des jetons. Vous pouvez augmenter cette prédiction avec des données dans une invite, et vous pouvez lister des outils dans une invite qui seront des complétions spéciales. Cela ne diminue en rien ce que chacune de ces choses fait. Même s'ils sont une solution coûteuse et par force brute au problème des réseaux neuronaux, les LLM sont des pièces de technologie incroyables. Comprendre que ce que nous voyons est l'ingéniosité humaine à découvrir de nouvelles façons d'utiliser cette technologie fondamentale aide à compenser ces préoccupations.  

Avec cette base en place, considérons le thème de cette année, qui était encore une fois les agents intelligents et l'IA agentique. Si l'année dernière consistait à intégrer des agents dans Copilot, cette année visait à déployer des agents partout et à adopter les normes qui ont commencé à émerger.  

Pourquoi le MCP est important: une utilisation des outils plus intelligente et plus naturelle

L'une des choses pour lesquelles j'ai été reconnaissant cette année a été l'occasion de passer du temps à approfondir ce qui fait fonctionner le protocole de contexte de modèle (MCP). À la base, c'est une façon intelligente de combiner la RAG et l'appel d'outils, afin que les agents puissent communiquer entre eux en utilisant le langage naturel.  

La façon dont les agents utilisent les outils est devenue beaucoup plus fluide avec le MCP. Auparavant, si vous vouliez qu'un assistant IA ou Copilot utilise une application ou un connecteur spécifique, vous deviez le nommer explicitement, ce qui rendait tout maladroit. Je me souviens avoir essayé d'utiliser l'Assistant Google à l'époque des premiers haut-parleurs intelligents et avoir dû dire « utiliseOurGroceries pour ajouter du beurre » juste pour obtenir la bonne application de liste de courses. Si je disais simplement « ajoute du beurre à la liste de courses », il passait par défaut à autre chose, comme Google Keep, parce qu'il ne comprenait pas mes préférences. Les extensions Teams avaient un problème similaire : vous deviez « @mentionner » exactement celle que vous vouliez au lieu que le système sache simplement quels outils étaient disponibles et choisisse le bon.

Le MCP corrige ce problème en donnant aux agents des descriptions claires de l'objectif de chaque outil (par exemple, « utilisez cet outil pour ajouter quelque chose à une liste d'épicerie »). Le modèle peut alors décider lui-même quand utiliser le bon outil, de la même manière que vous vous attendez à ce que quelqu'un prenne un marteau lorsque vous dites « Peux-tu enfoncer un clou? » sans que vous ayez besoin de le préciser. Lorsque vous ajoutez la mémorisation des préférences de l'utilisateur, l'expérience devient encore plus naturelle. Vous pouvez toujours demander une confirmation avant qu'un outil ne s'exécute, mais cela devient un choix de conception, et non une limitation technique. Après Ignite, j'ai quelques idées sur la façon d'améliorer encore notre solution ice Contact Center avec le MCP à l'avenir!

Les outils d'IA d'Azure en évolution rapide

Les outils de l'équipe Azure autour des services d'IA ont évolué à un rythme effréné. Auparavant, des outils comme Prompt Flow, Language Studio et Power Virtual Agents étaient au centre de l'attention, mais c'est maintenant AI Foundry qui occupe le devant de la scène. Foundry a simplifié le processus de création, de test et de déploiement d'agents d'IA en combinant la définition et l'hébergement des agents dans une interface unique et facile à utiliser. Pour quiconque développe des solutions d'IA, cela signifie beaucoup moins de temps de configuration et moins d'éléments à gérer.

L'une des fonctionnalités les plus intéressantes est la nouvelle capacité de génération augmentée par récupération (RAG) dans les bases de connaissances. Traditionnellement, l'extraction d'informations pertinentes pour un modèle d'IA pouvait nécessiter des invites (prompts) soigneusement élaborées, mais avec Foundry, le système peut générer automatiquement plusieurs termes de recherche, classer les résultats et alimenter l'agent avec le contexte le plus utile. En pratique, cela signifie que les agents peuvent répondre aux questions avec plus de précision et d'efficacité, sans qu'un développeur ait à ajuster manuellement chaque invite. Par exemple, vous pourriez avoir un agent qui extrait rapidement les documents ou enregistrements les plus pertinents d'une base de données, leur fournissant des réponses précises en quelques secondes.

Ce qui est particulièrement frappant, c'est la rapidité avec laquelle on peut prototyper et expérimenter avec des agents d'IA. J'ai pu assembler quelques prototypes rapides dans Foundry pour voir comment fonctionne la plateforme de création d'agents, et les fonctionnalités d'observabilité ainsi que les garde-fous intégrés facilitent la surveillance et le déploiement sécurisé de l'IA en production. Bien que nous soyons encore en train d'explorer quelle part de cette pile sera utilisée pour notre solution, la vitesse à laquelle on peut itérer est impressionnante. Une fois qu'une solution est construite, il y a des opportunités d'optimiser des éléments comme le coût et la performance, mais pour explorer les possibilités et tester de nouvelles idées, Foundry est un outil puissant pour les équipes qui cherchent à innover rapidement.

Utilisations créatives de l'IA à Ignite

Au-delà des outils, ce qui était formidable à Ignite cette année, c'était de voir comment les gens ont pris ces capacités fondamentales (prédiction de jetons, RAG, appel d'outils) et les ont combinées pour créer des systèmes intéressants. Par exemple, dans un laboratoire sur la mémoire sémantique, j'ai vu un exemple d'invite (prompt) extrêmement bien conçue qui inspectait le dialogue à chaque tour pour rechercher des « facettes » (un terme défini par le développeur) d'éléments à stocker comme souvenirs concernant l'appelant. Dans ce cas, il s'agissait de préférences de voyage, mais le plus intéressant était la façon dont l'invite était construite pour définir des règles, des catégories et des méthodes spécifiques pour évaluer un classement (préférence forte ou faible). Ayant construit des invites (prompts) tout aussi complexes pour certaines des fonctionnalités d'analyse des contacts dans ice, j'ai appris quelques nouvelles astuces.  

Il y a également eu l'occasion d'expérimenter les nouvelles fonctionnalités du serveur SQL qui permettent la recherche sémantique avec des types de vecteurs natifs, de sorte que tout est maintenant une base de données vectorielle. Il y a quelques endroits où nous effectuons déjà des recherches en texte intégral dans SQL (transcriptions de contacts et analyses), donc l'une des choses que nous allons essayer est de voir si rendre cela sémantique est efficace, et comment cela pourrait changer la façon dont nous créons les tâches d'analyse des contacts.  

Autres faits saillants notables à Ignite

En dehors de l'IA, il n'y a pas eu beaucoup de mises à jour dans d'autres domaines de Microsoft, ce qui est assez révélateur. Ignite, en tant qu'événement, est né du regroupement de plusieurs événements plus petits (TechEd, Lync, SharePoint, Exchange, etc.) en une seule méga-conférence couvrant tout ce qui touche à Microsoft. C'était excellent pour les personnes comme moi qui s'intéressent à l'étendue technologique, car cela signifiait pouvoir prendre connaissance de la stratégie globale de Microsoft et voir comment cela pourrait permettre ou compléter la stratégie de ComputerTalk pour l'année suivante. Avec la concentration unique sur l'IA au cours des dernières années, cela remet en question le degré d'investissement dans certains domaines technologiques, sauf dans la mesure où ils contribuent à l'adoption de l'IA. Teams, par exemple, avait à peine une présence, et des groupes comme Azure Communication Services étaient introuvables dans la liste des sessions.  

Il y a quand même eu quelques bonnes sessions sur l'infrastructure de base et les outils auxquelles j'ai assisté, sur des sujets comme Visual Studio 2026 et Azure Kubernetes Service. Il y avait aussi beaucoup d'experts des équipes produits de Microsoft sur le plancher de l'exposition, et j'ai eu de bonnes conversations sur des sujets comme Github, Azure Devops, Fabric, CosmosDB et divers autres éléments d'Azure, mais la plupart, sinon la totalité, des sessions, des discours d'ouverture et du contenu des laboratoires étaient filtrés à travers le prisme de l'IA.  

Perspectives pour 2026

Revenir à la réalité après une semaine à une conférence comme celle-ci est toujours un petit choc culturel. Comme je l'ai déjà dit, l'une des choses les plus précieuses des événements comme Ignite est l'occasion de prendre du recul et de voir ce que fait l'industrie, à quelles nouvelles choses nous devrions prêter attention, et de trouver de nouvelles idées sur la façon dont nous pouvons développer ice et ce que ComputerTalk peut faire. À cet égard, Ignite a certainement été un succès cette année, et j'ai une longue liste de choses à suivre, et de nouvelles relations à approfondir au cours de la prochaine année. J'ai déjà hâte de voir à quoi ressemblera l'événement de 2026 à San Francisco, et à quoi ressemblera le paysage de Microsoft et du CCaaS d'ici là.

Abonnez-vous à notre infolettre

Merci d'avoir communiqué avec ComputerTalk !

Nous prendrons contact avec vous sous peu. Il y a aussi un bouton de discussion maintenant dans le coin inférieur droit du site Web, si vous souhaitez nous parler immédiatement.

Oups ! Quelque chose s'est mal passé lors de la soumission du formulaire.