Retour au magazine

Comprendre la charge des centres de données : De la demande d'Énergie de l'IA à la stabilité du réseau

Comprendre la charge des centres de données : De la demande d'Énergie de l'IA à la stabilité du réseau

Que se passe-t-il lorsque l'IA consomme plus d'électricité qu'une partie de la consommation totale d'Énergie d'un pays par an ? Oui, il s'agit de centaines de milliers de térawattheures par an. On s'attend à ce que l'IA représente environ 20 % de la demande d'électricité des centres de données.

Graphique à zones empilées montrant la demande mondiale d'électricité pour les centres de données entre 2020 et 2030, avec une croissance tirée par les États-Unis, la Chine, l'Europe, l'Asie sans la Chine et le reste du monde, soulignant les augmentations rapides après 2024.
Figure 1. Consommation mondiale d'électricité des centres de données, par équipement, scénario de base, 2020-2030, selon les rapports de l'AIE.

La demande d'électricité induite par la prolifération des centres de données axés sur l'IA augmente. Elle devrait plus que doubler, passant de 415 TWh en 2024 à plus de 945 TWh en 2030, faisant des centres de données l'une des sources de charge électrique à la croissance la plus rapide dans les économies avancées. La course à la mise à l'échelle de l'IA n'est plus seulement une question de formation de modèles plus grands, c'est aussi une question d'Énergie. Les centres de données, qui étaient autrefois les piliers silencieux de l'économie numérique, sont aujourd'hui au cœur des débats mondiaux sur Énergie . Selon une étude de Goldman Sachs, les cinq plus grandes entreprises américaines à très grande échelle dépenseront ensemble 736 milliards de dollars en 2025 et 2026. Il ne s'agit pas seulement d'une statistique, mais d'un signal d'alarme.

Le défi caché : Les fluctuations de puissance dans les charges de travail d'IA

Les problèmes de gestion de l'énergie liés aux grandes charges de travail d'apprentissage de l'IA impliquent des dizaines de milliers de GPU. Une recherche traditionnelle sur Google consomme environ 0,3 wattheure (Wh) ; cependant, une requête utilisant une fonction d'IA telle qu'un ChatGPT ou une réponse alimentée par l'IA de Google peut consommer jusqu'à dix fois plus d'électricité, allant de 2,9 à 3,6 wattheures ou plus, en fonction de la tâche et du modèle employés. Pour mettre cela en perspective, Google traite environ 571 millions de recherches par heure (≈158 548 par seconde), tandis que ChatGPT traite à lui seul environ 104 millions d'invites par heure (≈2,5 milliards par jour), selon Axios. Cette énorme empreinte Énergie n'est pas concentrée en un seul endroit, mais plutôt répartie entre des centaines de centres de données hyperscale et d'entreprise dans le monde entier, chacun exploitant de vastes flottes de serveurs et de GPU. Cela signifie que même si le nombre de requêtes est inférieur, l'empreinte Énergie des recherches pilotées par l'IA peut rapidement dépasser celle des recherches traditionnelles. L'augmentation de la consommation d'Énergie pour les recherches d'IA est due aux calculs complexes nécessaires dans les modèles d'IA générative, par opposition à la recherche d'informations plus simple de la recherche classique.

Diagramme à barres illustrant les dépenses d'investissement des entreprises hyperscale de 2020 à 2026 en milliards de dollars américains, montrant une croissance historique jusqu'en 2023 et des augmentations prévues atteignant plus de 400 milliards de dollars d'ici 2026.
Figure 2. Dépenses d'investissement des entreprises hyperscale, Source : Goldman Sachs

La stabilité du réseau menacée

Il y a une phase de calcul intensif où chaque GPU travaille sur les données locales, et une période de communication intensive où tous les GPU se synchronisent sur les données parce que ces travaux sont synchrones. Les fluctuations de puissance sont importantes car les phases de calcul intensif consomment beaucoup plus d'énergie que les phases de communication. L'amplitude de ces fluctuations de puissance augmente avec le nombre de tâches de formation. La gamme de fréquences de ces fluctuations de puissance présente une difficulté encore plus grande (illustrée dans la figure 3 pour le lama) car elle est susceptible de perturber physiquement l'infrastructure du réseau électrique si elle coïncide avec les fréquences essentielles des services publics. Nous devons donc stabiliser la puissance de ces charges de travail.

Graphique linéaire montrant l'appel de puissance au niveau des nœuds pendant l'entraînement du modèle Llama-70B sur un système simulé à 8 nœuds, illustrant la fluctuation de l'appel de puissance entre 6 000 et 8 800 watts sur plusieurs nœuds pendant six minutes.
Figure 3. Exemple de demande d'énergie pendant l'entraînement Llama-70B sur 8 nœuds, Source : 2024 United States Data Center Énergie Usage Report by Berkeley Lab Énergie Analysis and Environmental Impact Division.

Charge typique d'un centre de données : Refroidissement, sauvegarde et électronique de puissance complexe

Chaque centre de données contient plusieurs serveurs et génère donc une grande quantité de chaleur lors du traitement des données. Le fonctionnement de ces serveurs et le maintien du refroidissement sont l'une des principales causes de la consommation d'électricité.

Ces charges se caractérisent par une consommation d'Énergie élevée, une demande opérationnelle fluctuante et des besoins de refroidissement importants. La configuration interne de la charge, qui comprend l'alimentation de secours et la protection interne, peut être extrêmement complexe. Étant donné que les centres de données et autres demandes de calcul se trouvent souvent dans des endroits où l'électricité est abordable et fiable, une planification rigoureuse du réseau et des techniques de connexion sont nécessaires. Étant donné que les charges à grande échelle domineront progressivement les futurs systèmes électriques, le principal défi consiste à aborder ces difficultés de manière proactive afin de mieux comprendre la dynamique du réseau.

Intérieur d'un centre de données moderne avec des rangées de baies de serveurs éclairées en bleu et une superposition de réseaux numériques lumineux symbolisant l'informatique en nuage, le traitement de l'IA et l'infrastructure de données à haute performance.

Tout aussi important, le secteur manque encore de réglementations claires et de méthodes normalisées pour la modélisation et l'intégration de charges aussi complexes, ce qui fait de l'accès aux données et de leur cohérence un défi croissant pour les planificateurs et les chercheurs.

Pour les centres de données, le défi réside dans le fait que plusieurs composants interagissent sur des échelles de temps très différentes : les systèmes de protection, l'électronique de puissance, les contrôleurs et le système de gestion de l'Énergie (EMS), d'autant plus que la plupart des centres de données s'appuient sur des sources de secours telles que les onduleurs ou les groupes électrogènes. Les événements de commutation rapide à l'intérieur des convertisseurs se produisent en microsecondes, tandis que les systèmes de protection et les comportements de dépassement sont observés en millisecondes.

Il est essentiel de tester les interactions entre tous ces systèmes, non seulement pour valider les conceptions actuelles, mais aussi pour explorer de nouvelles approches et technologies de contrôle qui pourraient contribuer à atténuer les impacts sur le réseau, tels que l'E-STATCOM, l'écrêtement des pointes ou la compensation réactive. La simulation Simulation HIL permet de tester les deux extrémités de ce spectre. Les outils basés sur les FPGA capturent les harmoniques de commutation ultra-rapides des redresseurs, des onduleurs et des transformateurs à semi-conducteurs, tandis que les solveurs basés sur les CPU gèrent des comportements plus lents mais tout aussi critiques, tels que la stabilité de la tension et la traversée des défauts. En combinant ces outils, vous pouvez valider la façon dont les systèmes internes d'un centre de données interagissent avec le réseau plus large, en veillant à ce que le refroidissement, l'alimentation de secours et les charges électroniques complexes restent stables, même en cas de stress.

Alors que les centres de données continuent de s'étendre en taille et en complexité, leur impact sur les systèmes Énergie mondiaux ne peut être ignoré. La combinaison d'une demande massive d'électricité, de charges fluctuantes et d'exigences importantes en matière de refroidissement souligne le besoin urgent d'une planification plus intelligente du réseau et de solutions d'ingénierie innovantes. En adoptant la simulation en temps réel, la modélisation avancée et une conception plus efficace de l'infrastructure, l'industrie peut s'assurer que les centres de données restent des pierres angulaires fiables, durables et résilientes de l'économie numérique.