Sie haben bestimmt schon alles Mögliche gehört, von „KI trinkt alle paar Fragen eine ganze Flasche Wasser“ bis hin zu „Es sind nur ein paar Tropfen“. Die Wahrheit ist jedoch vielschichtiger. Der Wasserverbrauch einer KI variiert stark, je nachdem, wo sie läuft, wie lang die Eingabeaufforderung ist und wie das Rechenzentrum seine Server kühlt. Die genannte Zahl ist also zwar richtig, aber sie ist von vielen Einschränkungen geprägt.
Im Folgenden präsentiere ich Ihnen klare, entscheidungsrelevante Zahlen, erkläre, warum die Schätzungen voneinander abweichen, und zeige, wie Bauherren und Alltagsnutzer den Wasserverbrauch reduzieren können, ohne dabei zu Nachhaltigkeitsmönchen zu werden.
Artikel, die Sie im Anschluss an diesen vielleicht lesen möchten:
🔗 Was ist ein KI-Datensatz?
Erläutert, wie Datensätze das Training von maschinellem Lernen und die Modellentwicklung ermöglichen.
🔗 Wie KI Trends vorhersagt
Zeigt, wie KI Muster analysiert, um Veränderungen und zukünftige Ergebnisse vorherzusagen.
🔗 Wie man die Leistung von KI misst
Erläutert die wichtigsten Kennzahlen zur Beurteilung von Genauigkeit, Geschwindigkeit und Zuverlässigkeit.
🔗 Wie man mit KI spricht
Leitet effektive Prompt-Strategien an, um Klarheit, Ergebnisse und Konsistenz zu verbessern.
Wie viel Wasser verbraucht KI? Kurze, praxisnahe Zahlen 📏
-
Die typische Textlänge pro Eingabeaufforderung variiert heute: von unter einem Milliliter für eine durchschnittliche Texteingabeaufforderung in einem gängigen System bis hin zu mehreren zehn Millilitern für eine längere, rechenintensive Antwort in einem anderen. Googles Produktionsabrechnung gibt beispielsweise eine durchschnittliche Texteingabeaufforderung von ca. 0,26 ml (einschließlich des gesamten Bereitstellungsaufwands) [1]. Mistrals Lebenszyklusanalyse beziffert die Textlänge einer 400-Token-Antwort des Assistenten auf ca. 45 ml (marginale Schätzung) [2]. Kontext und Modell spielen eine entscheidende Rolle.
-
Das Training eines Modells im Grenzbereich Millionen Liter Wasser erfordern , hauptsächlich für Kühlung und die Wassernutzung bei der Stromerzeugung. Eine vielzitierte wissenschaftliche Analyse schätzte den Wasserverbrauch für das Training eines GPT-Modells ca. 5,4 Millionen Liter ca. 700.000 Liter für die Kühlung vor Ort, und plädierte für eine intelligente Einsatzplanung zur Reduzierung des Wasserverbrauchs [3].
-
Im Allgemeinen verbrauchen große bei großen Betreibern durchschnittlich Hunderttausende Gallonen pro Tag
Seien wir ehrlich: Diese Zahlen wirken auf den ersten Blick widersprüchlich. Und das sind sie auch. Dafür gibt es gute Gründe.

KI-gestützte Wasserverbrauchsmetriken ✅
Eine gute Antwort auf die Frage „ Wie viel Wasser verbraucht KI?“ sollte einige Kriterien erfüllen:
-
Abgrenzung:
Beinhaltet dies nur Kühlwasser vor Ort oder auch das Wasser, das von Kraftwerken zur Stromerzeugung außerhalb Wasserentnahme und Wasserverbrauch sowie zwischen den Bereichen 1, 2 und 3, ähnlich wie bei der CO₂-Bilanzierung [3]. -
Standortabhängigkeit
Der Wasserverbrauch pro kWh variiert je nach Region und Netzmix, sodass ein und dieselbe Aufforderung je nach Einsatzort unterschiedliche Auswirkungen auf den Wasserverbrauch haben kann – ein wichtiger Grund, warum in der Literatur eine zeit- und ortsbezogene Planung [3]. -
Realistische Arbeitslast:
Spiegelt die Zahl die durchschnittliche Produktionsauslastung , einschließlich Leerlaufkapazität und Rechenzentrums-Overhead, oder nur die Auslastung des Beschleunigers in der Spitzenzeit? Google betont die Bedeutung einer vollständigen Systembetrachtung (Leerlaufkapazität, CPUs/DRAM und Rechenzentrums-Overhead) für die Inferenz, nicht nur die Berechnung der TPU [1]. -
Kühltechnologien
wie Verdunstungskühlung, geschlossene Flüssigkeitskreisläufe, Luftkühlung und neuartige Direktkühlungsverfahren für Chips verändern den Wasserverbrauch drastisch. Microsoft führt Designs ein, die den Kühlwasserverbrauch für bestimmte Standorte der nächsten Generation eliminieren sollen [4]. -
Tageszeit und Jahreszeit:
Hitze, Luftfeuchtigkeit und Netzbedingungen beeinflussen die Effektivität der Wassernutzung im Alltag; eine einflussreiche Studie schlägt vor, größere Arbeiten dann und dort zu planen, wo die Wasserintensität geringer ist [3].
Wasserentnahme vs. Wasserverbrauch, erklärt 💡
-
Wasserentnahme = Wasser, das aus Flüssen, Seen oder Grundwasserleitern entnommen wird (ein Teil wird zurückgeführt).
-
Verbrauch = Wasser, das nicht zurückgeführt wird , weil es verdunstet oder in Prozesse/Produkte eingearbeitet wird.
Kühltürme verbrauchen Wasser hauptsächlich durch Verdunstung. Die Stromerzeugung kann entnehmen (und teilweise verbrauchen). Eine zuverlässige KI kennzeichnet den Wasserverbrauch anhand der gemeldeten Werte [3].
Wohin das Wasser in der KI fließt: die drei Eimer 🪣
-
Scope 1 – Kühlung vor Ort.
Der sichtbare Teil: Wasser, das direkt im Rechenzentrum verdunstet. Konstruktionsentscheidungen wie Verdunstungskühlung im Vergleich zu Luftkühlung oder geschlossenem Flüssigkeitskreislauf bilden die Grundlage [5]. -
Scope 2 - Stromerzeugung
Jede kWh kann ein verstecktes Wasseretikett tragen; die Mischung und der Standort bestimmen das Liter-pro-kWh-Signal, das Ihre Arbeitslast erbt [3]. -
Bereich 3 – Lieferkette
: Die Chipherstellung ist auf Reinstwasser angewiesen. Dies wird in einer Kennzahl „pro Vorgang“ nicht berücksichtigt, es sei denn, die Abgrenzung schließt explizit die grauen Stoffe ein (z. B. eine vollständige Ökobilanz) [2][3].
Anbieter im Überblick, mit allen Nuancen 🧮
-
Google Gemini verwendet
die Full-Stack-Serving-Methode (einschließlich Leerlauf und Anlagenkosten). Der mittlere Textaufruf verbraucht ca. 0,26 ml Wasser und ca. 0,24 Wh Energie; die Werte berücksichtigen den Produktionsverkehr und die Gesamtgrenzen [1]. -
Mistral Large 2 Lebenszyklus
Eine seltene unabhängige LCA (mit ADEME/Carbone 4) zeigt ~281.000 m³ für Training + frühe Nutzung und eine Inferenzmarginalität von ~45 mL für eine 400-Token- Assistentenantwort [2]. -
Microsofts Ziel der wasserlosen Kühlung:
Rechenzentren der nächsten Generation sind so konzipiert, dass sie kein Wasser zur Kühlung verbrauchen und dabei auf Direktkühlung der Chips setzen; für administrative Zwecke wird jedoch weiterhin etwas Wasser benötigt [4]. -
Im allgemeinen Rechenzentrumsmaßstab
berichten große Betreiber öffentlich von durchschnittlich Hunderttausenden Gallonen pro Tag an einzelnen Standorten; Klima und Bauart beeinflussen die Zahlen nach oben oder unten [5]. -
Die frühere akademische Basislinie
Die wegweisende Analyse der „durstigen KI“ schätzte, dass Millionen Liter für das Training von GPT-Klasse-Modellen benötigt würden und dass 10–50 mittlere Antworten 500-ml- entsprechen könnten – stark abhängig davon, wann und wo sie ausgeführt werden [3].
Warum die Schätzungen so stark voneinander abweichen 🤷
-
Unterschiedliche Abgrenzungen.
Einige Berechnungen berücksichtigen nur die Kühlung vor Ort ; andere beziehen auch das Wasser für die Stromerzeugung ; Ökobilanzen können die Chipherstellung . Äpfel, Orangen und Obstsalat [2][3]. -
Unterschiedliche Arbeitslasten
Eine kurze Texteingabeaufforderung ist kein langer multimodaler/Code-Lauf; Batchverarbeitung, Parallelverarbeitung und Latenzziele verändern die Auslastung [1][2]. -
Unterschiedliche Klimazonen und Netze:
Verdunstungskühlung in einer heißen, trockenen Region ≠ Luft-/Flüssigkeitskühlung in einer kühlen, feuchten Region. Die Wasserintensität im Netz variiert stark [3]. -
Die Anbietermethoden:
Google veröffentlichte eine systemweite Methode zur Bereitstellung von Diensten; Mistral veröffentlichte eine formale Ökobilanz. Andere bieten Punktschätzungen mit spärlichen Methoden an. Die vielbeachtete nur „ein Fünfzehntel Teelöffel“ verbraucht werde, sorgte für Schlagzeilen – doch ohne detaillierte Angaben zu den Abgrenzungen ist sie nicht vergleichbar [1][3]. -
Die
Kühlung entwickelt sich rasant. Microsoft erprobt wasserlose Kühlung ; die flächendeckende Einführung dieser Technologien wird den Wasserverbrauch vor Ort reduzieren, selbst wenn die Stromversorgung weiterhin ein Wassersignal enthält [4].
Was Sie heute tun können, um den Wasserfußabdruck von KI zu reduzieren 🌱
-
Die richtige Modellgröße wählen:
Kleinere, aufgabenoptimierte Modelle erreichen häufig die gleiche Genauigkeit bei geringerem Rechenaufwand. Mistrals Bewertung unterstreicht die starke Korrelation zwischen Modellgröße und Ressourcenbedarf und veröffentlicht marginale Inferenzzahlen, um Abwägungen zu ermöglichen [2]. -
Wählen Sie wassersparende Regionen.
Bevorzugen Sie Regionen mit kühlerem Klima, effizienter Kühlung und Netzen mit geringerer Wasserintensität pro kWh; die Arbeit über „durstige KI“ zeigt, dass eine zeit- und ortsbezogene Planung hilfreich ist [3]. -
Verschieben Sie die Arbeitslasten zeitlich.
Planen Sie das Training/die rechenintensive Batch-Inferenz für wassersparende Stunden (kühlere Nächte, günstige Netzbedingungen) [3]. -
Bitten Sie Ihren Anbieter um transparente Kennzahlen, z. B.
Wasserbedarf pro Bestellung , die Definition der Versorgungsgrenzen und ob ungenutzte Kapazitäten und Betriebskosten berücksichtigt werden. Politische Gruppen drängen auf eine verpflichtende Offenlegung, um einen direkten Vergleich zu ermöglichen [3]. -
Die Kühltechnologie ist wichtig.
Wenn Sie Hardware einsetzen, sollten Sie geschlossene Kühlkreisläufe/Direktkühlung für den Chip ; wenn Sie Cloud-Lösungen nutzen, sollten Sie Regionen/Anbieter bevorzugen, die in wassersparende Designs [4][5]. -
Grauwasser und Wiederverwendungsmöglichkeiten nutzen
Viele Campusgelände können nicht-trinkbare Quellen ersetzen oder innerhalb von Kreisläufen recyceln; große Betreiber beschreiben, wie sie Wasserquellen und Kühlmethoden aufeinander abstimmen, um die Nettoauswirkungen zu minimieren [5].
Ein kurzes Beispiel zur Veranschaulichung (keine allgemeingültige Regel): Die Verlegung einer nächtlichen Schulungsmaßnahme von einer heißen, trockenen Region im Hochsommer in eine kühlere, feuchtere Region im Frühling – und deren Durchführung außerhalb der Spitzenzeiten und in kühleren Stunden – kann sowohl den Wasserverbrauch vor Ort außerhalb des Betriebsgeländes (Netz) beeinflussen. Das ist die Art von praktischen, unkomplizierten Erfolgen, die eine optimierte Einsatzplanung ermöglichen kann [3].
Vergleichstabelle: Schnelle Tipps zur Senkung des Wasserverbrauchs in der KI 🧰
| Werkzeug | Publikum | Preis | warum es funktioniert |
|---|---|---|---|
| Kleinere, aufgabenorientierte Modelle | ML-Teams, Produktleiter | Niedrig–mittel | Weniger Rechenleistung pro Token = weniger Kühlung + Strom und Wasser; nachgewiesen in einer Berichterstattung im LCA-Stil [2]. |
| Regionsauswahl nach Wasser/kWh | Cloud-Architekten, Beschaffung | Medium | Umstellung auf kühlere Klimazonen und Netze mit geringerer Wasserintensität; in Kombination mit bedarfsorientierter Routenplanung [3]. |
| Trainingsfenster zu verschiedenen Tageszeiten | MLOps, Scheduler | Niedrig | Kühlere Nächte und bessere Netzbedingungen verringern die effektive Wasserintensität [3]. |
| Direkte Chipkühlung/geschlossener Kreislauf | Rechenzentrumsbetrieb | Mittel bis hoch | Wo immer möglich, werden Verdunstungstürme vermieden, wodurch der Verbrauch vor Ort deutlich reduziert wird [4]. |
| Eingabeaufforderungslänge und Chargensteuerung | App-Entwickler | Niedrig | Unkontrollierte Token-Überschreitungen begrenzen, intelligent bündeln, Ergebnisse zwischenspeichern; weniger Millisekunden, weniger Milliliter [1][2]. |
| Checkliste für Lieferantentransparenz | CTOs, Nachhaltigkeitsbeauftragte | Frei | Klarheit der Abgrenzung (vor Ort vs. außerhalb des Geländes) und vergleichbare Berichterstattung [3]. |
| Grauwasser oder wiederaufbereitete Quellen | Einrichtungen, Gemeinden | Medium | Der Ersatz von Wasser durch nicht trinkbares Wasser entlastet die Trinkwasserversorgung [5]. |
| Partnerschaften zur Wärmerückgewinnung | Betreiber, Kommunen | Medium | Eine bessere thermische Effizienz senkt indirekt den Kühlbedarf und stärkt das lokale Wohlwollen [5]. |
(Der Begriff „Preis“ ist bewusst flexibel gehalten – die Umsetzung kann variieren.)
Tiefer Einblick: Der politische Trommelwirbel wird immer lauter 🥁
Ingenieurverbände fordern die verpflichtende Offenlegung des Energie- und Wasserverbrauchs von Rechenzentren, damit Käufer und Kommunen Kosten und Nutzen abwägen können. Zu den Empfehlungen gehören Definitionen des Geltungsbereichs, standortbezogene Berichterstattung und Standortrichtlinien – denn ohne vergleichbare, standortbezogene Kennzahlen tappen wir im Dunkeln [3].
Tiefer Einblick: Nicht alle Rechenzentren arbeiten nach dem gleichen Prinzip 🚰
Es hält sich hartnäckig der Mythos, dass Luftkühlung kein Wasser benötigt. Das stimmt so nicht ganz. Luftintensive Systeme benötigen oft mehr Strom , der in vielen Regionen mit Wasser aus dem Stromnetz betrieben wird; umgekehrt Wasserkühlung den Stromverbrauch und die Emissionen senken, allerdings auf Kosten der Wasserversorgung vor Ort. Große Betreiber wägen diese Vor- und Nachteile standortspezifisch ab [1][5].
Tiefer Einblick: Ein kurzer Realitätscheck zu viralen Behauptungen 🧪
Vielleicht haben Sie schon kühne Behauptungen gesehen, dass eine einzelne Eingabe „einer Wasserflasche“ entspricht oder, im anderen Extremfall, „nur ein paar Tropfen“. Besser ist es, die realistisch zu betrachten . Glaubwürdige Richtwerte liegen heute bei etwa 0,26 ml für eine durchschnittliche Eingabe mit vollem Aufwand [1] und bei etwa 45 ml für eine Antwort eines Assistenten mit 400 Token (marginale Inferenz) [2]. Die viel zitierte von „einem Fünfzehntel Teelöffel“ entbehrt einer öffentlichen Definition; behandeln Sie sie wie eine Wettervorhersage ohne Angabe der Stadt [1][3].
Mini-FAQ: Wie viel Wasser verbraucht KI? Noch einmal in einfachen Worten 🗣️
-
Was sollte ich also in einem Meeting sagen?
„Je nach Aufgabe variiert die Menge von wenigen Tropfen bis zu ein paar Schlucken , abhängig vom Modell, der Länge und dem Einsatzort. Für das Training benötigt man größere Mengen , keine kleinen Mengen.“ Dann ein oder zwei der oben genannten Beispiele anführen. -
Ist KI in besonderem Maße schlecht?
Sie ist in besonderem Maße konzentriert : Hochleistungschips, die dicht beieinander liegen, erzeugen einen hohen Kühlbedarf. Aber Rechenzentren sind auch der Ort, an dem die effizientesten Technologien tendenziell zuerst zum Einsatz kommen [1][4]. -
Was wäre, wenn wir komplett auf Luftkühlung umstellen würden?
Man könnte zwar vor Ort extern erhöhen . Erfahrene Betreiber wägen beides sorgfältig ab [1][5]. -
Und wie sieht es mit zukünftigen Technologien aus?
Konstruktionen, die auf Kühlwasser in großem Umfang verzichten, wären ein Wendepunkt für Scope 1. Einige Betreiber gehen diesen Weg bereits; der vorgelagerte Strom trägt noch immer ein Wassersignal in sich, solange sich die Netze nicht ändern [4].
Schlussbemerkung – Zu lang, ich habe es nicht gelesen 🌊
-
Pro Eingabeaufforderung: Rechnen Sie mit einem Volumen von unter einem Milliliter bis zu mehreren zehn Millilitern , abhängig vom Modell, der Länge der Eingabeaufforderung und dem Ausführungsort. Der Medianwert für eine Eingabeaufforderung liegt bei etwa 0,26 ml in einem großen Stack; bei einer Antwort mit 400 Tokens in einem anderen Stack liegt er bei etwa 45 ml [1][2].
-
Training: Millionen Liter für Spitzenmodelle, wodurch Planung, Standortwahl und Kühltechnik von entscheidender Bedeutung sind [3].
-
Was zu tun ist: Modelle richtig dimensionieren, wassersparende Regionen auswählen, schwere Arbeiten in kühlere Stunden verlagern, Anbieter bevorzugen, die wassersparende Designs anbieten, und transparente Grenzen fordern [1][3][4][5].
Zum Schluss eine etwas unpassende Metapher: KI ist ein durstiges Orchester – die Melodie ist der Computer, aber die Trommeln sind kühlendes Leitungswasser. Stimmt man die Band, bekommt das Publikum die Musik trotzdem, ohne dass die Sprinkleranlage angeht. 🎻💦
Verweise
-
Google Cloud Blog – Wie viel Energie verbraucht Googles KI? Wir haben es nachgerechnet (Methodik + ca. 0,26 ml durchschnittlicher Energieverbrauch, vollständiger Overhead). Link
(Technisches Dokument (PDF): Messung der Umweltauswirkungen der KI-Bereitstellung im Google-Maßstab ) . -
Mistral AI – Unser Beitrag zu einem globalen Umweltstandard für KI (LCA mit ADEME/Carbon 4; ~281.000 m³ Training + frühe Nutzung; ~45 ml pro 400-Token -Antwort, marginale Inferenz). Link
-
Li et al. – KI weniger „durstig“ machen: Aufdeckung und Bewältigung des verborgenen Wasserfußabdrucks von KI-Modellen (Training mit Millionen Litern Wasser , zeit- und ortsbezogene Planung, Wasserentnahme vs. -verbrauch). Link
-
Microsoft – Rechenzentren der nächsten Generation benötigen kein Wasser zur Kühlung (Direkt-auf-Chip-Designs für wasserfreie Kühlung an bestimmten Standorten). Link
-
Google-Rechenzentren – Nachhaltiger Betrieb (Abwägungen bei der Kühlung an den einzelnen Standorten; Berichterstattung und Wiederverwendung, einschließlich Brauchwasser/Grauwasser; typische tägliche Verbrauchsmengen an den Standorten). Link