Quelle quantité d'eau utilise l'IA ?

Quelle quantité d'eau l'IA utilise-t-elle ?

Vous avez sans doute déjà entendu toutes sortes d'affirmations, de « l'IA boit une bouteille d'eau toutes les quelques questions » à « il ne s'agit que de quelques gouttes ». La réalité est plus nuancée. L'empreinte hydrique de l'IA varie considérablement selon son environnement d'exécution, la longueur de votre question et le système de refroidissement des serveurs du centre de données. Alors oui, ce chiffre principal existe, mais il est entouré de nombreuses réserves.

Ci-dessous, je présente des chiffres clairs et exploitables, j'explique pourquoi les estimations divergent et je montre comment les constructeurs et les utilisateurs quotidiens peuvent réduire leur consommation d'eau sans se transformer en moines écologistes.

Articles que vous aimeriez peut-être lire après celui-ci :

🔗 Qu'est-ce qu'un ensemble de données d'IA ?
Explique comment les ensembles de données permettent l'entraînement des algorithmes d'apprentissage automatique et le développement de modèles.

🔗 Comment l'IA prédit les tendances
Démontre comment l'IA analyse les tendances pour prévoir les changements et les résultats futurs.

🔗 Comment mesurer les performances de l'IA
Analyse les indicateurs clés permettant d'évaluer la précision, la rapidité et la fiabilité.

🔗 Comment parler à l'IA
Guide des stratégies d'incitation efficaces pour améliorer la clarté, les résultats et la cohérence.


Quelle quantité d'eau consomme l'IA ? Des chiffres concrets et faciles à utiliser 📏

  • Par invite, la consommation de données varie généralement de quelques millilitres pour une invite textuelle standard sur un système courant, jusqu'à plusieurs dizaines de millilitres pour une réponse plus longue et plus gourmande en ressources de calcul sur un autre. Par exemple, les données de production de Google indiquent une consommation médiane d'environ 0,26 ml pour une invite textuelle (avec tous les temps de traitement inclus) [1]. L'analyse du cycle de vie de Mistral estime la consommation d'une réponse d'assistant de 400 jetons à environ 45 ml (estimation marginale) [2]. Le contexte et le modèle sont des facteurs déterminants.

  • L’entraînement d’un modèle à grande échelle peut nécessiter des millions de litres d’eau , principalement pour le refroidissement et la production d’électricité. Une analyse académique largement citée a estimé à environ 5,4 millions de litres nécessaire à l’entraînement d’un modèle de type GPT, dont environ 700 000 litres consommés sur site pour le refroidissement. Cette analyse préconise une planification intelligente de la consommation d’eau afin de réduire l’intensité hydrique [3].

  • Centres de données en général : les grands sites traitent des centaines de milliers de gallons par jour chez les principaux opérateurs, avec des pics plus élevés sur certains campus en fonction du climat et de la conception [5].

Soyons honnêtes : ces chiffres semblent incohérents au premier abord. Et ils le sont. Il y a de bonnes raisons à cela.

 

IA assoiffée

Métriques de consommation d'eau basées sur l'IA ✅

Une bonne réponse à la question « Quelle quantité d'eau l'IA utilise-t-elle ? » devrait répondre à plusieurs critères :

  1. Clarté des limites :
    Cela inclut-il uniquement de refroidissement sur site , ou également hors site utilisée par les centrales électriques pour produire de l’électricité ? Les meilleures pratiques distinguent le prélèvement d’eau de la consommation d’eau et définissent des périmètres 1-2-3, similaires à la comptabilité carbone [3].

  2. Sensibilité à l'emplacement
    La consommation d'eau par kWh varie selon la région et le type de réseau, de sorte que la même invite peut avoir des impacts différents sur l'eau selon l'endroit où elle est diffusée - une raison clé pour laquelle la littérature recommande une planification tenant compte du temps et du lieu [3].

  3. Réalisme de la charge de travail :
    Le chiffre reflète-t-il les requêtes de production médianes , y compris la capacité inactive et la surcharge du centre de données, ou seulement l’accélérateur en période de pointe ? Google insiste sur la comptabilisation complète du système (inactivité, processeurs/DRAM et surcharge du centre de données) pour l’inférence, et non pas seulement sur les calculs TPU [1].

  4. Les technologies de refroidissement, telles
    que le refroidissement par évaporation, le refroidissement liquide en circuit fermé, le refroidissement par air et les nouvelles direct sur puce, modifient considérablement la consommation d'eau. Microsoft déploie actuellement des solutions visant à éliminer le recours à l'eau de refroidissement pour certains sites de nouvelle génération [4].

  5. L'heure de la journée et la saison
    La chaleur, l'humidité et les conditions du réseau modifient l'efficacité de l'utilisation de l'eau dans la vie réelle ; une étude influente suggère de programmer les travaux importants lorsque et où l'intensité de l'eau est plus faible [3].


Prélèvements d'eau vs consommation d'eau, explications 💡

  • Prélèvement = eau prélevée dans les rivières, les lacs ou les aquifères (une partie est restituée).

  • Consommation = eau non restituée car elle s'évapore ou est incorporée dans les procédés/produits.

consomment principalement de l'eau par évaporation. La production d'électricité peut en prélever d'importants volumes (en consommant parfois une partie), selon l'installation et la méthode de refroidissement. Un indicateur fiable de la consommation d'eau par IA est fourni [3].


Où va l'eau dans l'IA : les trois seaux 🪣

  1. Périmètre 1 - Refroidissement sur site
    La partie visible : l’eau s’évapore au sein même du centre de données. Les choix de conception, tels que le refroidissement par évaporation, par air ou par liquide en circuit fermé, définissent la base [5].

  2. Portée 2 - production d'électricité
    Chaque kWh peut transporter une étiquette d'eau cachée ; le mélange et l'emplacement déterminent le signal en litres par kWh que votre charge de travail hérite [3].

  3. Portée 3 - Chaîne d'approvisionnement :
    La fabrication de puces dépend de l'utilisation d'eau ultra-pure. Cette utilisation n'apparaît pas dans une métrique « par requête » à moins que le périmètre n'inclue explicitement les impacts liés à l'incorporation (par exemple, une analyse du cycle de vie complète) [2][3].


Les fournisseurs en chiffres, avec nuance 🧮

  • Google Gemini propose
    une méthode de service complète (incluant la consommation d'énergie et les frais généraux liés à l'infrastructure). La consommation médiane est d'environ 0,26 mL d'eau et 0,24 Wh d'énergie ; ces chiffres reflètent le trafic de production et les limites globales [1].

  • Cycle de vie du Mistral Large 2
    Une analyse LCA indépendante rare (avec ADEME/Carbone 4) révèle ~281 000 m³ pour l'entraînement + l'utilisation précoce et une marge d'inférence ~45 mL pour une de 400 jetons [2].

  • L'ambition de Microsoft en matière de refroidissement sans eau
    Les centres de données de nouvelle génération sont conçus pour ne consommer aucune eau pour le refroidissement , en s'appuyant sur des approches directes sur la puce ; les utilisations administratives nécessitent toujours un peu d'eau [4].

  • Échelle générale des centres de données
    Les principaux opérateurs font état publiquement de centaines de milliers de gallons par jour en moyenne sur les sites individuels ; le climat et la conception font monter ou descendre les chiffres [5].

  • L'analyse académique de référence
    antérieure « IA assoiffée » estimait à des millions de litres la quantité nécessaire pour entraîner des modèles de classe GPT, et que 10 à 50 réponses moyennes pouvaient à peu près correspondre à une de 500 mL - en fonction du moment et de l'endroit où elles sont exécutées [3].


Pourquoi les estimations divergent-elles autant ? 🤷

  • Des limites différentes.
    Certaines études ne prennent en compte que le refroidissement sur site ; d’autres ajoutent l’eau liée à l’électricité ; les ACV peuvent inclure la fabrication des puces . Comparer des pommes, des oranges et de la salade de fruits [2][3].

  • Différentes charges de travail
    Une courte invite de texte n'est pas une longue exécution multimodale/de code ; le traitement par lots, la concurrence et les objectifs de latence modifient l'utilisation [1][2].

  • Différents climats et réseaux :
    le refroidissement par évaporation dans une région chaude et aride n’est pas équivalent au refroidissement par air/liquide dans une région fraîche et humide. L’intensité de l’eau dans le réseau varie considérablement [3].

  • Concernant les méthodologies des fournisseurs,
    Google a publié une méthode de distribution à l'échelle du système ; Mistral a publié une analyse du cycle de vie (ACV) formelle. D'autres proposent des estimations ponctuelles avec des méthodes plus sommaires. Une affirmation très médiatisée, selon laquelle la serait « un quinzième de cuillère à café » par invite, a fait les gros titres, mais sans précision quant aux limites, elle n'est pas comparable [1][3].

  • Un objectif en constante
    évolution. Le refroidissement évolue rapidement. Microsoft teste actuellement des systèmes de refroidissement sans eau sur certains sites ; leur déploiement permettra de réduire la consommation d’eau sur site, même si le réseau électrique en amont transporte toujours un signal d’eau [4].


Ce que vous pouvez faire aujourd'hui pour réduire l'empreinte hydrique de l'IA 🌱

  1. Dimensionnez correctement votre modèle :
    des modèles plus petits et optimisés pour la tâche offrent souvent une précision équivalente tout en consommant moins de ressources de calcul. L’évaluation de Mistral souligne la forte corrélation entre la taille et l’empreinte mémoire, et publie des données d’inférence marginales permettant d’évaluer les compromis [2].

  2. Choisissez des régions économes en eau.
    Privilégiez les régions avec des climats plus frais, un refroidissement efficace et des réseaux avec une intensité d'eau plus faible par kWh ; les travaux sur « l'IA assoiffée » montrent que en fonction du temps et du lieu est utile [3].

  3. Décaler les charges de travail dans le temps.
    Planifier l'entraînement/l'inférence par lots lourds pour les heures efficaces en eau (nuits plus fraîches, conditions de grille favorables) [3].

  4. Demandez à votre fournisseur des indicateurs transparents :
    consommation d’eau par demande , définition des limites de la zone et prise en compte ou non de la capacité inutilisée et des frais généraux de l’installation. Les instances décisionnelles militent pour une divulgation obligatoire afin de permettre des comparaisons équitables [3].

  5. La technologie de refroidissement est importante.
    Si vous utilisez du matériel, évaluez le refroidissement en boucle fermée/direct sur la puce ; si vous êtes sur le cloud, privilégiez les régions/fournisseurs qui investissent dans des conceptions à faible consommation d'eau [4][5].

  6. Utiliser les eaux grises et les options de réutilisation
    De nombreux campus peuvent substituer des sources non potables ou recycler dans des boucles ; les grands opérateurs décrivent l'équilibre des sources d'eau et des choix de refroidissement pour minimiser l'impact net [5].

Un exemple concret (il ne s'agit pas d'une règle absolue) : déplacer une formation de nuit d'une région chaude et sèche en plein été vers une région plus fraîche et humide au printemps, et la programmer pendant les heures creuses, permet de réduire la sur site et du réseau . Voilà le genre d'avantage pratique et sans complications que peut apporter une planification bien pensée [3].


Tableau comparatif : solutions rapides pour réduire la consommation d’eau de l’IA 🧰

outil public prix pourquoi ça marche
Des modèles plus petits et adaptés à la tâche équipes ML, responsables de produits Faible–moyen Moins de calcul par jeton = moins de refroidissement + électricité + eau ; prouvé dans les rapports de type ACV [2].
Sélection de la région par eau/kWh architectes cloud, approvisionnement Moyen Passer à des climats plus frais et à des réseaux avec une intensité d'eau plus faible ; associer à un routage prenant en compte la demande [3].
Fenêtres d'entraînement en fonction de l'heure de la journée MLOps, planificateurs Faible Des nuits plus fraîches et de meilleures conditions de réseau réduisent l’intensité effective de l’eau [3].
Refroidissement direct sur puce/en circuit fermé Opérations des centres de données moyennement élevée Évite les tours d’évaporation lorsque cela est possible, réduisant ainsi la consommation sur site [4].
Contrôles de longueur et de lot des prompts Développeurs d'applications Faible Limitez les jetons fugitifs, traitez-les intelligemment par lots, mettez les résultats en cache ; moins de millisecondes, moins de millilitres [1][2].
Liste de contrôle de la transparence des fournisseurs CTO, responsables du développement durable Gratuit Clarté des limites des forces (sur site vs hors site) et rapports comparables [3].
Eaux grises ou sources recyclées Infrastructures, municipalités Moyen Le remplacement de l’eau non potable soulage la pression sur les ressources en eau potable [5].
Partenariats de réutilisation de la chaleur Opérateurs, conseils locaux Moyen Une meilleure efficacité thermique réduit indirectement la demande de refroidissement et renforce la confiance locale [5].

(« Le prix » est volontairement flexible – les déploiements varient.)


Analyse approfondie : le discours politique se fait de plus en plus insistant 🥁

Les organismes d'ingénierie préconisent la divulgation obligatoire des données relatives à la consommation d'énergie et d'eau des centres de données afin que les acheteurs et les collectivités puissent évaluer les coûts et les avantages. Leurs recommandations comprennent la définition du périmètre d'intervention, la production de rapports au niveau du site et des directives d'implantation, car sans indicateurs comparables et adaptés à la localisation, nous naviguons à vue [3].


Analyse approfondie : les centres de données ne consomment pas tous d’énergie de la même manière 🚰

Il existe un mythe tenace selon lequel « le refroidissement par air ne consomme pas d'eau ». C'est inexact. Les systèmes à air consomment souvent plus d'électricité , laquelle, dans de nombreuses régions, transporte l'eau du réseau de manière indirecte ; à l'inverse, le refroidissement par eau permet de réduire la consommation d'énergie et les émissions, au prix d'une consommation d'eau supplémentaire sur site. Les grands exploitants évaluent précisément ces compromis pour chaque site [1][5].


Analyse approfondie : un rapide examen de la réalité concernant les affirmations virales 🧪

Vous avez peut-être vu des affirmations péremptoires selon lesquelles une seule dose équivaut à « une bouteille d'eau », ou, à l'inverse, à « quelques gouttes seulement ». Une approche plus juste consiste à faire preuve d'humilité face aux mathématiques . Les valeurs de référence actuelles sont d'environ 0,26 mL pour une dose moyenne avec tous les frais de service [1] et d'environ 45 mL pour une réponse d'assistant de 400 jetons (inférence marginale) [2]. L'affirmation souvent partagée selon laquelle une équivaut à « un quinzième de cuillère à café » manque de cadre et de méthode précis ; considérez-la comme une prévision météorologique sans indication de ville [1][3].


Mini-FAQ : Quelle quantité d’eau l’IA utilise-t-elle ? (Réponse en langage clair) 🗣️

  • Alors, que devrais-je dire en réunion ?
    « Pour chaque consigne, cela varie de quelques gouttes à quelques gorgées , selon le modèle, la durée et le contexte. La formation nécessite des groupes importants , pas des flaques d’eau. » Citez ensuite un ou deux exemples ci-dessus.

  • L'IA est-elle particulièrement néfaste ?
    Elle est particulièrement concentrée : les puces haute puissance regroupées en un grand nombre génèrent d'importants besoins en refroidissement. Mais les centres de données sont aussi ceux où les technologies les plus performantes en matière d'efficacité énergétique sont généralement déployées en premier [1][4].

  • Et si l'on passait entièrement au refroidissement par air ?
    On pourrait réduire sur site tout en augmentant hors site grâce à l'électricité. Les opérateurs expérimentés prennent en compte ces deux facteurs [1][5].

  • Qu’en est-il des technologies futures ?
    Les conceptions qui évitent le refroidissement de l’eau à grande échelle changeraient la donne pour le Scope 1. Certains opérateurs s’orientent dans cette direction ; l’électricité en amont transporte toujours un signal d’eau jusqu’à ce que les réseaux changent [4].


Remarques finales - Trop long, je ne l'ai pas lu 🌊

  • Par invite : de quelques millilitres à plusieurs dizaines de millilitres , selon le modèle, la longueur de l’invite et l’environnement d’exécution. La quantité médiane d’une invite est d’environ 0,26 mL sur une pile majeure ; réponse de 400 jetons

  • Formation : des millions de litres pour les modèles de pointe, rendant la planification, l'implantation et la technologie de refroidissement essentielles [3].

  • Que faire : adapter les modèles, choisir des régions économes en eau, déplacer les travaux lourds vers les heures plus fraîches, privilégier les fournisseurs proposant des conceptions économes en eau et exiger des limites transparentes [1][3][4][5].

Métaphore un peu bancale pour finir : l’IA est un orchestre assoiffé – la mélodie, c’est le calcul, mais la batterie, c’est le refroidissement et l’eau du réseau. Accordez l’orchestre, et le public profitera toujours de la musique sans que les arroseurs automatiques ne se déclenchent. 🎻💦


Références

  1. Blog Google Cloud - Quelle est la consommation énergétique de l'IA de Google ? Nous avons effectué les calculs (méthodologie + ~0,26 ml en moyenne par requête, frais généraux de service complets). Lien
    (Document technique PDF : de l'IA à l'échelle de Google ).

  2. Mistral AI - Notre contribution à une norme environnementale mondiale pour l'IA (ACV avec ADEME/Carbone 4 ; ~281 000 m³ pour l'entraînement et les premières utilisations ; ~45 mL par de 400 jetons , inférence marginale). Lien

  3. Li et al. - Rendre l'IA moins « gourmande » en eau : révéler et réduire l'empreinte hydrique cachée des modèles d'IA (entraînement de millions de litres , tenant compte du temps et du lieu , prélèvement vs consommation). Lien

  4. Microsoft - Les centres de données de nouvelle génération ne consomment plus d'eau pour le refroidissement (conceptions à refroidissement direct sur puce visant un refroidissement sans eau sur certains sites). Lien

  5. Centres de données Google - Fonctionnement durable (compromis en matière de refroidissement site par site ; rapports et réutilisation, y compris des eaux grises/récupérées ; ordres de grandeur de la consommation quotidienne typique par site). Lien

Découvrez les dernières IA sur la boutique officielle AI Assistant

À propos de nous

Retour au blog