Berapa banyak Air yang digunakan oleh AI?

Saya yakin anda telah mendengar segala-galanya daripada "AI meminum sebotol air setiap beberapa soalan" kepada "ia pada asasnya beberapa titis,". Kebenaran lebih bernuansa. Jejak air AI berubah secara meluas berdasarkan tempat ia berjalan, berapa lama gesaan anda dan cara pusat data menyejukkan pelayannya. Jadi ya, nombor tajuk itu wujud, tetapi ia tinggal di dalam rimbunan kaveat.

Di bawah saya membongkar nombor yang jelas dan sedia membuat keputusan, menerangkan sebab anggaran tidak bersetuju dan menunjukkan cara pembina dan pengguna harian boleh mengecilkan tab air tanpa bertukar menjadi sami kelestarian.

Artikel yang mungkin anda ingin baca selepas ini:

🔗 Apakah set data AI
Menjelaskan cara set data membolehkan latihan pembelajaran mesin dan pembangunan model.

🔗 Bagaimana AI meramalkan arah aliran
Menunjukkan cara AI menganalisis corak untuk meramalkan perubahan dan hasil masa hadapan.

🔗 Cara mengukur prestasi AI
Memecahkan metrik penting untuk menilai ketepatan, kelajuan dan kebolehpercayaan.

🔗 Cara bercakap dengan AI
Membimbing strategi dorongan yang berkesan untuk meningkatkan kejelasan, hasil dan konsistensi.

Berapa banyak air yang digunakan oleh AI? Nombor pantas sebenarnya boleh anda gunakan 📏

Setiap gesaan, julat biasa hari ini: daripada sub-mililiter untuk gesaan teks median pada satu sistem arus perdana, sehingga berpuluh-puluh mililiter untuk tindak balas pengiraan yang lebih lama dan lebih tinggi pada yang lain. Sebagai contoh, perakaunan pengeluaran Google melaporkan gesaan teks median ~0.26 mL (dengan overhed hidangan penuh disertakan) [1]. Penilaian kitaran hayat Mistral mematok balasan pembantu 400 token pada ~45 mL (inferens marginal) [2]. Konteks dan model sangat penting.
Melatih model skala sempadan: boleh mencecah berjuta-juta liter , kebanyakannya daripada penyejukan dan air yang tertanam dalam penjanaan elektrik. Analisis akademik yang dipetik secara meluas menganggarkan ~5.4 juta liter untuk melatih model kelas GPT, termasuk ~700,000 liter yang digunakan di tapak untuk penyejukan - dan berhujah untuk penjadualan pintar untuk menurunkan intensiti air [3].
Pusat data secara umum: tapak besar menjangkau ratusan ribu gelen sehari secara purata di operator utama, dengan puncak yang lebih tinggi di beberapa kampus bergantung pada iklim dan reka bentuk [5].

Sejujurnya: angka tersebut pada mulanya berasa tidak konsisten. Mereka adalah. Dan ada sebab yang baik.

Metrik penggunaan air AI ✅

Jawapan yang baik untuk Berapa banyak air yang digunakan oleh AI? hendaklah menandakan beberapa kotak:

Kejelasan sempadan
Adakah ia termasuk hanya penyejuk di tapak , atau juga air di luar tapak loji kuasa untuk menjana elektrik? Amalan terbaik membezakan pengeluaran air berbanding penggunaan air dan skop 1-2-3, serupa dengan perakaunan karbon [3].
Kepekaan lokasi
Air bagi setiap kWj berbeza mengikut rantau dan campuran grid, jadi gesaan yang sama boleh membawa kesan air yang berbeza bergantung pada tempat ia dihidangkan - sebab utama literatur mengesyorkan penjadualan sedar masa dan tempat [3].
Realisme beban kerja
Adakah bilangan itu mencerminkan gesaan pengeluaran median , termasuk kapasiti terbiar dan overhed pusat data, atau hanya pemecut pada puncak? Google menekankan perakaunan sistem penuh (terbiar, CPU/DRAM dan overhed pusat data) untuk inferens, bukan hanya matematik TPU [1].
Teknologi penyejukan
Penyejukan penyejatan, penyejukan cecair gelung tertutup, penyejukan udara, dan terus ke cip mengubah keamatan air secara mendadak. Microsoft sedang melancarkan reka bentuk yang bertujuan untuk menghapuskan penggunaan air penyejuk untuk tapak gen seterusnya tertentu [4].
Masa dalam hari dan musim
Keadaan haba, kelembapan dan grid mengalihkan keberkesanan penggunaan air dalam kehidupan sebenar; satu kajian yang berpengaruh mencadangkan penjadualan pekerjaan utama bila dan di mana intensiti air lebih rendah [3].

Penarikan air vs penggunaan air, dijelaskan 💡

Penarikan = air yang diambil dari sungai, tasik, atau akuifer (ada yang dikembalikan).
Penggunaan = air tidak dikembalikan kerana ia sejat atau dimasukkan ke dalam proses/produk.

Menara penyejuk terutamanya menggunakan air melalui penyejatan. Penjanaan elektrik boleh mengeluarkan jumlah yang besar (kadang-kadang memakan sebahagian daripadanya), bergantung kepada loji dan kaedah penyejukan. Label nombor air AI yang boleh dipercayai yang dilaporkannya [3].

Ke mana air masuk ke AI: tiga baldi 🪣

Skop 1 - penyejukan di tapak
Bahagian yang boleh dilihat: air tersejat di pusat data itu sendiri. Pilihan reka bentuk seperti penyejatan lwn. udara atau cecair gelung tertutup menetapkan garis dasar [5].
Skop 2 - penjanaan elektrik
Setiap kWj boleh membawa tag air tersembunyi; campuran dan lokasi menentukan isyarat liter-per-kWj beban kerja anda diwarisi [3].
Skop 3 - rantaian bekalan
Pembuatan cip bergantung kepada air ultra tulen dalam fabrikasi. Anda tidak akan melihatnya dalam metrik "setiap gesaan" melainkan sempadan itu secara eksplisit menyertakan kesan yang terkandung (cth, LCA penuh) [2][3].

Penyedia mengikut nombor, dengan nuansa 🧮

Google Gemini menggesa
kaedah penyajian tindanan penuh (termasuk melahu dan overhed kemudahan). Teks median gesaan ~0.26 mL air bersama ~0.24 Wj tenaga; angka mencerminkan trafik pengeluaran dan sempadan komprehensif [1].
Kitaran hayat Mistral Large 2
LCA bebas yang jarang berlaku (dengan ADEME/Carbone 4) mendedahkan ~281,000 m³ untuk latihan + penggunaan awal dan marginal inferens ~45 mL untuk 400 token [2].
Cita-cita penyejukan sifar air Microsoft
Pusat data next-gen direka untuk menggunakan air sifar untuk penyejukan , bersandar pada pendekatan terus kepada cip; penggunaan admin masih memerlukan sedikit air [4].
Skala pusat data am
Pengendali utama secara umum melaporkan ratusan ribu gelen sehari secara purata di tapak individu; iklim dan reka bentuk menolak nombor ke atas atau ke bawah [5].
Garis asas akademik yang lebih awal
Analisis mani "haus AI" menganggarkan berjuta-juta liter untuk melatih model kelas GPT, dan bahawa 10–50 jawapan sederhana boleh kira-kira sama dengan 500 mL - sangat bergantung pada bila/tempat ia dijalankan [3].

Kenapa anggaran sangat tidak setuju 🤷

Sempadan yang berbeza
Sesetengah angka hanya mengira penyejukan di tapak ; yang lain menambah air elektrik ; LCA boleh menambah pembuatan cip . Epal, oren dan salad buah [2][3].
Beban kerja yang berbeza
Gesaan teks pendek bukanlah jangka panjang multimodal/kod; penggolongan, konkurensi dan sasaran kependaman mengubah penggunaan [1][2].
Iklim dan grid yang berbeza
Penyejukan penyejatan di kawasan yang panas dan gersang ≠ penyejukan udara/cecair dalam kawasan yang sejuk dan lembap. Keamatan air grid berbeza-beza secara meluas [3].
Metodologi vendor
Google menerbitkan kaedah penyajian seluruh sistem; Mistral menerbitkan LCA rasmi. Yang lain menawarkan anggaran mata dengan kaedah yang jarang. berprofil tinggi "satu per lima belas sudu teh" setiap segera menjadi tajuk utama - tetapi tanpa butiran sempadan, ia tidak dapat dibandingkan [1][3].
Sasaran bergerak
Penyejukan sedang berkembang pesat. Microsoft sedang merintis penyejukan tanpa air di tapak tertentu; melancarkan ini akan mengurangkan air di tapak walaupun elektrik hulu masih membawa isyarat air [4].

Apa yang anda boleh lakukan hari ini untuk mengurangkan jejak air AI 🌱

Model bersaiz betul
Model yang lebih kecil, disesuaikan dengan tugas selalunya sepadan dengan ketepatan sambil membakar kurang pengiraan. Penilaian Mistral menggariskan korelasi saiz-ke-jejak yang kukuh - dan menerbitkan nombor inferens marginal supaya anda boleh membuat alasan tentang pertukaran [2].
Pilih kawasan bijak air
Lebih suka kawasan dengan iklim yang lebih sejuk, penyejukan yang cekap dan grid dengan keamatan air yang lebih rendah setiap kWj; kerja "AI dahaga" menunjukkan yang sedar masa dan tempat membantu [3].
Anjakan beban kerja dalam masa
Jadualkan latihan/inferens kelompok berat untuk jam cekap air (malam yang lebih sejuk, keadaan grid yang menggalakkan) [3].
Tanya vendor anda untuk metrik telus
Permintaan air sejurus , definisi sempadan dan sama ada nombor termasuk kapasiti terbiar dan overhed kemudahan. Kumpulan dasar mendesak pendedahan mandatori untuk membuat perbandingan epal-ke-epal mungkin [3].
Perkara teknologi penyejukan
Jika anda menjalankan perkakasan, nilaikan penyejukan gelung tertutup/terus-ke-cip ; jika anda menggunakan awan, pilih kawasan/penyedia yang melabur dalam reka bentuk cahaya air [4][5].
Gunakan pilihan air kelabu dan guna semula
Banyak kampus boleh menggantikan sumber yang tidak boleh diminum atau mengitar semula dalam gelung; operator besar menerangkan sumber air mengimbangi dan pilihan penyejukan untuk meminimumkan impak bersih [5].

Contoh pantas untuk menjadikannya nyata (bukan peraturan sejagat): mengalihkan kerja latihan semalaman daripada kawasan panas dan kering pada pertengahan musim panas ke kawasan yang lebih sejuk dan lebih lembap pada musim bunga - dan menjalankannya semasa waktu luar puncak dan lebih sejuk - boleh mengalihkan kedua-dua di tapak dan keamatan air di luar tapak Itulah jenis penjadualan kemenangan drama rendah yang praktikal boleh dibuka [3].

Jadual perbandingan: pilihan pantas untuk menurunkan tol air AI 🧰

alat	penonton	harga	mengapa ia berfungsi
Model yang lebih kecil, disesuaikan dengan tugas	Pasukan ML, petunjuk produk	Rendah–sederhana	Kurang pengiraan setiap token = kurang penyejukan + air elektrik; terbukti dalam pelaporan gaya LCA [2].
Pemilihan wilayah mengikut air/kWj	Arkitek awan, perolehan	Sederhana	Beralih kepada iklim dan grid yang lebih sejuk dengan keamatan air yang lebih rendah; berpasangan dengan penghalaan sedar permintaan [3].
Tetingkap latihan masa dalam sehari	MLOps, penjadual	Rendah	Malam yang lebih sejuk + keadaan grid yang lebih baik mengurangkan keamatan air yang berkesan [3].
Penyejukan terus-ke-cip/gelung tertutup	Operasi pusat data	Med–tinggi	Elakkan menara penyejat jika boleh, mengurangkan penggunaan di tapak [4].
Kawalan panjang & kumpulan segera	Pembangun apl	Rendah	Hadkan token pelarian, kumpulan dengan bijak, keputusan cache; kurang milisaat, lebih sedikit mililiter [1][2].
Senarai semak ketelusan vendor	CTO, petunjuk kemampanan	Percuma	Memaksa kejelasan sempadan (di tapak vs luar tapak) dan pelaporan epal-ke-epal [3].
Air kelabu atau sumber tebus guna	Kemudahan, majlis perbandaran	Sederhana	Menggantikan air tidak boleh diminum melegakan tekanan pada bekalan boleh diminum [5].
Perkongsian guna semula haba	Pengendali, majlis tempatan	Sederhana	Kecekapan haba yang lebih baik secara tidak langsung mengurangkan permintaan penyejukan dan membina muhibah tempatan [5].

(“Harga” adalah licin mengikut reka bentuk - penggunaan berbeza-beza.)

Menyelam dalam: paluan dram polisi semakin kuat 🥁

Badan kejuruteraan meminta pendedahan mandatori tenaga dan air pusat data supaya pembeli dan komuniti boleh menilai kos dan faedah. Pengesyoran termasuk definisi skop, pelaporan peringkat tapak dan panduan penempatan - kerana tanpa metrik yang mengetahui lokasi yang setanding, kami bertengkar dalam gelap [3].

Menyelam dalam: pusat data tidak semuanya menyedut dengan cara yang sama 🚰

Terdapat mitos yang berterusan bahawa "penyejukan udara tidak menggunakan air." Tidak cukup. Sistem berat udara selalunya memerlukan lebih banyak elektrik , yang di banyak wilayah membawa air tersembunyi dari grid; sebaliknya, penyejukan air boleh mengurangkan kuasa dan pelepasan pada kos air di tapak. Pengendali besar secara eksplisit mengimbangi pertukaran tapak demi tapak ini [1][5].

Penyelaman mendalam: semakan realiti pantas pada dakwaan viral 🧪

Anda mungkin pernah melihat kenyataan yang berani bahawa satu gesaan sama dengan "sebotol air," atau, di sisi lain, "hanya beberapa titis." Postur yang lebih baik: merendah diri dengan matematik . Penamat buku yang boleh dipercayai hari ini ialah ~0.26 mL untuk gesaan pengeluaran median dengan overhed hidangan penuh [1] dan ~45 mL untuk balasan pembantu 400-token (inferens marginal) [2]. "satu per lima belas sudu teh" yang banyak dikongsi tidak mempunyai sempadan/kaedah awam; anggap ia seperti ramalan cuaca tanpa bandar [1][3].

Soalan Lazim Mini: Berapa banyak air yang digunakan oleh AI? sekali lagi, dalam bahasa Inggeris biasa 🗣️

Jadi, apa yang perlu saya katakan dalam mesyuarat?
"Setiap gesaan, ia terdiri daripada titisan hingga beberapa teguk , bergantung pada model, panjang dan tempat ia berjalan. Latihan memerlukan kolam , bukan lopak." Kemudian nyatakan satu atau dua contoh di atas.
Adakah AI secara unik buruk?
Ia tertumpu : cip berkuasa tinggi yang dibungkus bersama menghasilkan beban penyejukan yang besar. Tetapi pusat data juga merupakan tempat teknologi kecekapan terbaik cenderung untuk mendarat dahulu [1][4].
Bagaimana jika kita hanya memindahkan segala-galanya ke penyejukan udara?
Anda mungkin memotong di tapak tetapi menambah di luar tapak melalui elektrik. Pengendali canggih menimbang kedua-duanya [1][5].
Bagaimana pula dengan teknologi masa depan?
Reka bentuk yang mengelakkan air penyejuk pada skala akan menjadi penukar permainan untuk Skop 1. Sesetengah pengendali bergerak dengan cara ini; elektrik hulu masih membawa isyarat air sehingga grid berubah [4].

Catatan Akhir - Terlalu Panjang, Saya Tidak Membacanya 🌊

Setiap gesaan: fikirkan sub-mililiter hingga berpuluh-puluh mililiter , bergantung pada model, panjang gesaan dan tempat ia dijalankan. Gesaan median ~0.26 mL pada satu timbunan utama; ~45 mL untuk balasan 400 token pada yang lain [1][2].
Latihan: berjuta-juta liter untuk model sempadan, menjadikan penjadualan, penempatan dan teknologi penyejukan kritikal [3].
Perkara yang perlu dilakukan: model bersaiz betul, pilih kawasan bijak air, alihkan kerja berat kepada waktu yang lebih sejuk, lebih suka vendor yang membuktikan reka bentuk cahaya air dan menuntut sempadan yang telus [1][3][4][5].

Metafora yang cacat sedikit untuk berakhir: AI ialah orkestra yang dahaga - melodinya dikira, tetapi gendangnya menyejukkan dan air grid. Tarik band, dan penonton masih mendapat muzik tanpa perenjis berbunyi. 🎻💦

Rujukan

Blog Awan Google - Berapa banyak tenaga yang digunakan oleh AI Google? Kami melakukan pengiraan (metodologi + ~0.26 mL gesaan median, overhed hidangan penuh). Pautan
(Kertas teknikal PDF: Mengukur kesan alam sekitar untuk menyampaikan AI pada skala Google .) Pautan
Mistral AI - Sumbangan kami kepada standard persekitaran global untuk AI (LCA dengan ADEME/Carbone 4; ~281,000 m³ + penggunaan awal; ~45 mL setiap 400 token , inferens marginal). Pautan
Li et al. - Menjadikan AI Kurang “Dagas”: Mendedahkan dan Menangani Jejak Air Rahsia Model AI (melatih berjuta-juta liter , masa dan tempat yang sedar , penarikan diri berbanding penggunaan). Pautan
Microsoft - Pusat data generasi akan datang menggunakan air sifar untuk penyejukan (reka bentuk terus ke cip menyasarkan penyejukan tanpa air di tapak tertentu). Pautan
Pusat Data Google - Beroperasi secara mampan (pertimbangan penyejukan tapak demi tapak; pelaporan dan penggunaan semula, termasuk tebus guna/air kelabu; susunan magnitud penggunaan peringkat tapak harian biasa). Pautan

Cari AI Terkini di Kedai Pembantu AI Rasmi

Tentang Kami

Kembali ke blog

Negara/rantau