KubeCon Europe 2024, Microsoft dévoile plusieurs nouveautés

Par:
fredericmazue

mar, 19/03/2024 - 13:51

L’une des annonces les plus intéressantes est la préversion publique du module complémentaire AI Toolchain Operator (KAITO) pour AKS. KAITO suit d'abord notre philosophie de l'open source, c'est un projet sur GitHub que tout le monde peut exécuter, et maintenant il fait également partie d'AKS. Grâce à KAITO, vous pouvez désormais exécuter des charges de travail d'apprentissage automatique spécialisées telles que des modèles de langage étendus (LLM) sur AKS de manière plus rentable et avec moins de configuration manuelle. Rationalisé en quelques étapes, le module complémentaire KAITO pour AKS automatise le déploiement LLM sur les ressources CPU et GPU disponibles en sélectionnant une infrastructure de taille optimale pour le modèle. Ce module complémentaire permet de diviser facilement l’inférence sur plusieurs machines virtuelles (VM) à nombre de GPU inférieur, augmentant ainsi le nombre de régions Azure où les charges de travail peuvent s’exécuter, éliminant les temps d’attente pour les VM à nombre de GPU plus élevé et réduisant le coût global. Vous pouvez également choisir parmi des modèles prédéfinis avec des images hébergées par AKS, réduisant ainsi considérablement le temps global de configuration du service d'inférence sur votre cluster.

Microsoft a également annoncé plusieurs nouvelles fonctionnalités et améliorations pour aider à adopter Kubernetes en toute confiance et commodité. Voici quelques points importants:

  • Garanties de déploiement : les garanties de déploiement pour AKS (préversion) sont une nouvelle fonctionnalité qui applique les meilleures pratiques Kubernetes dans votre cluster AKS via les contrôles Azure Policy. Avec l'introduction de deux niveaux de configuration, « Avertissement » et « Application », vous pouvez bénéficier d'une surveillance de vos fichiers manifestes Kubernetes. Cette fonctionnalité vous permet soit de recevoir des avertissements immédiats pour les fichiers manifestes mal configurés au moment du déploiement, soit de bloquer carrément le déploiement de ces fichiers.
  • Planification intelligente de la charge de travail dans Azure Kubernetes Fleet Manager : la planification de la charge de travail de flotte est un nouveau composant open source que nous avons développé pour vous aider à optimiser l'utilisation des ressources de votre cluster. Il vous permet de placer les charges de travail dans des clusters en fonction de nouvelles heuristiques, telles que le coût et la disponibilité des ressources. Vous pouvez également personnaliser les ressources spécifiques au cluster en ciblant des groupes de clusters via le remplacement des ressources.
  • Prise en charge de Windows : Microsoft a apporté plusieurs améliorations à notre prise en charge de Windows dans AKS, notamment la disponibilité générale des machines virtuelles Windows Gen 2 et la configuration personnalisée du kubelet. Ces fonctionnalités vous permettent d'exécuter des charges de travail Windows sur AKS avec de meilleures performances, sécurité et compatibilité.