Berapa banyak Air yang digunakan oleh AI?

Saya yakin anda telah mendengar segala-galanya daripada "AI meminum sebotol air setiap beberapa soalan" kepada "ia pada asasnya beberapa titis,". Kebenaran lebih bernuansa. Jejak air AI berubah secara meluas berdasarkan tempat ia berjalan, berapa lama gesaan anda dan cara pusat data menyejukkan pelayannya. Jadi ya, nombor tajuk itu wujud, tetapi ia tinggal di dalam rimbunan kaveat.

Di bawah saya membongkar nombor yang jelas dan sedia membuat keputusan, menerangkan sebab anggaran tidak bersetuju dan menunjukkan cara pembina dan pengguna harian boleh mengecilkan tab air tanpa bertukar menjadi sami kelestarian.

Artikel yang mungkin anda ingin baca selepas ini:

🔗 Apakah set data AI
Menjelaskan cara set data membolehkan latihan pembelajaran mesin dan pembangunan model.

🔗 Bagaimana AI meramalkan arah aliran
Menunjukkan cara AI menganalisis corak untuk meramalkan perubahan dan hasil masa hadapan.

🔗 Cara mengukur prestasi AI
Memecahkan metrik penting untuk menilai ketepatan, kelajuan dan kebolehpercayaan.

🔗 Cara bercakap dengan AI
Membimbing strategi dorongan yang berkesan untuk meningkatkan kejelasan, hasil dan konsistensi.

Berapa banyak air yang digunakan oleh AI? Nombor pantas sebenarnya boleh anda gunakan 📏

Setiap gesaan, julat tipikal hari ini: daripada sub-mililiter untuk gesaan teks median pada satu sistem arus perdana, sehingga puluhan mililiter untuk respons yang lebih panjang dan berkomputer lebih tinggi pada sistem lain. Contohnya, perakaunan pengeluaran Google melaporkan gesaan teks median ~0.26 mL (termasuk overhed hidangan penuh) [1]. Penilaian kitaran hayat Mistral menetapkan balasan pembantu 400 token pada ~45 mL (inferens marginal) [2]. Konteks dan model sangat penting.
Melatih model skala sempadan: boleh mencecah berjuta-juta liter, kebanyakannya daripada penyejukan dan air yang tertanam dalam penjanaan elektrik. Analisis akademik yang dipetik secara meluas menganggarkan ~5.4 juta liter untuk melatih model kelas GPT, termasuk ~700,000 liter yang digunakan di tapak untuk penyejukan - dan berhujah untuk penjadualan pintar untuk menurunkan intensiti air [3].
Pusat data secara umum: tapak besar menjangkau ratusan ribu gelen sehari secara purata di operator utama, dengan puncak yang lebih tinggi di beberapa kampus bergantung pada iklim dan reka bentuk [5].

Sejujurnya: angka tersebut pada mulanya berasa tidak konsisten. Mereka adalah. Dan ada sebab yang baik.

Metrik penggunaan air AI ✅

Jawapan yang baik untuk Berapa banyak air yang digunakan oleh AI? hendaklah menandakan beberapa kotak:

Kejelasan sempadan Adakah ia termasuk hanya air penyejuk di tapak , atau juga air di luar tapak yang digunakan oleh loji kuasa untuk menjana elektrik? Amalan terbaik membezakan pengeluaran air berbanding penggunaan air dan skop 1-2-3, serupa dengan perakaunan karbon [3].
Kepekaan lokasi
Air setiap kWh berbeza mengikut rantau dan campuran grid, jadi gesaan yang sama boleh membawa impak air yang berbeza bergantung pada tempat ia dilayan - sebab utama literatur mengesyorkan penjadualan yang mengambil kira masa dan tempat [3].
Realisme beban kerja
Adakah bilangan itu mencerminkan gesaan pengeluaran median, termasuk kapasiti terbiar dan overhed pusat data, atau hanya pemecut pada puncak? Google menekankan perakaunan sistem penuh (terbiar, CPU/DRAM dan overhed pusat data) untuk inferens, bukan hanya matematik TPU [1].
Teknologi penyejukan
Penyejukan penyejatan, penyejukan cecair gelung tertutup, penyejukan udara, dan terus ke cip mengubah keamatan air secara mendadak. Microsoft sedang melancarkan reka bentuk yang bertujuan untuk menghapuskan penggunaan air penyejuk untuk tapak gen seterusnya tertentu [4].
Masa dalam hari dan musim
Keadaan haba, kelembapan dan grid mengalihkan keberkesanan penggunaan air dalam kehidupan sebenar; satu kajian yang berpengaruh mencadangkan penjadualan pekerjaan utama bila dan di mana intensiti air lebih rendah [3].

Penarikan air vs penggunaan air, dijelaskan 💡

Penarikan = air yang diambil dari sungai, tasik, atau akuifer (ada yang dikembalikan).
Penggunaan = air tidak dikembalikan kerana ia sejat atau dimasukkan ke dalam proses/produk.

Menara penyejuk terutamanya menggunakan air melalui penyejatan. Penjanaan elektrik boleh mengeluarkan isipadu yang besar (kadang-kadang memakan sebahagian daripadanya), bergantung pada loji dan kaedah penyejukan. Label nombor AI-air yang boleh dipercayai yang dilaporkannya [3].

Ke mana air masuk ke AI: tiga baldi 🪣

Skop 1 - penyejukan di tapak
Bahagian yang boleh dilihat: air tersejat di pusat data itu sendiri. Pilihan reka bentuk seperti penyejatan lwn. udara atau cecair gelung tertutup menetapkan garis dasar [5].
Skop 2 - penjanaan elektrik
Setiap kWj boleh membawa tag air tersembunyi; campuran dan lokasi menentukan isyarat liter-per-kWj beban kerja anda diwarisi [3].
Skop 3 - rantaian bekalan
Pembuatan cip bergantung pada air ultra-tulen dalam fabrikasi. Anda tidak akan melihatnya dalam metrik "setiap gesaan" melainkan sempadan tersebut secara eksplisit merangkumi impak yang terkandung (cth., LCA penuh) [2][3].

Penyedia mengikut nombor, dengan nuansa 🧮

Google Gemini menggesa
kaedah penyajian tindanan penuh (termasuk melahu dan overhed kemudahan). Teks median gesaan ~0.26 mL air bersama ~0.24 Wj tenaga; angka mencerminkan trafik pengeluaran dan sempadan komprehensif [1].
Kitaran hayat Mistral Large 2
LCA bebas yang jarang ditemui (dengan ADEME/Carbone 4) mendedahkan ~281,000 m³ untuk latihan + penggunaan awal dan margin inferens ~45 mL untuk 400-token [2].
Cita-cita penyejukan sifar air Microsoft
Pusat data generasi akan datang direka bentuk untuk menggunakan sifar air untuk penyejukan, bergantung pada pendekatan terus ke cip; penggunaan pentadbir masih memerlukan sedikit air [4].
Skala pusat data am
Pengendali utama secara umum melaporkan ratusan ribu gelen sehari secara purata di tapak individu; iklim dan reka bentuk menolak nombor ke atas atau ke bawah [5].
Garis dasar akademik terdahulu
Analisis "AI dahaga" yang penting menganggarkan berjuta-juta liter untuk melatih model kelas GPT, dan 10–50 jawapan sederhana secara kasarnya boleh menyamai 500 mL - sangat bergantung pada bila/di mana ia dijalankan [3].

Kenapa anggaran sangat tidak setuju 🤷

Sempadan berbeza
Sesetengah angka hanya mengira penyejukan di tapak; yang lain menambah air elektrik; LCA mungkin menambah pembuatan cip. Epal, oren dan salad buah [2][3].
Beban kerja yang berbeza
Gesaan teks pendek bukanlah larian multimodal/kod yang panjang; sasaran pengelompokan, keserentakan dan kependaman mengubah penggunaan [1][2].
Iklim dan grid yang berbeza
Penyejukan penyejatan di kawasan panas dan gersang ≠ penyejukan udara/cecair di kawasan sejuk dan lembap. Keamatan air grid berbeza-beza dengan ketara [3].
Metodologi vendor
Google menerbitkan kaedah penyajian seluruh sistem; Mistral menerbitkan LCA formal. Yang lain menawarkan anggaran mata dengan kaedah jarang. Dakwaan berprofil tinggi "satu perlima belas sudu teh" setiap gesaan menjadi tajuk utama - tetapi tanpa butiran sempadan, ia tidak setanding [1][3].
Sasaran bergerak
Penyejukan sedang berkembang pesat. Microsoft sedang merintis penyejukan tanpa air di tapak tertentu; melancarkan ini akan mengurangkan air di tapak walaupun elektrik hulu masih membawa isyarat air [4].

Apa yang anda boleh lakukan hari ini untuk mengurangkan jejak air AI 🌱

Saiz model yang betul
Model yang lebih kecil dan ditala tugasan kerap kali sepadan dengan ketepatan sambil mengurangkan pengiraan. Penilaian Mistral menggariskan korelasi saiz-ke-jejak yang kuat - dan menerbitkan nombor inferens marginal supaya anda boleh membuat pertimbangan tentang pertukaran [2].
Pilih kawasan mengikut air.
Lebih suka kawasan yang mempunyai iklim yang lebih sejuk, penyejukan yang cekap dan grid dengan keamatan air yang lebih rendah setiap kWh; kerja “AI yang dahaga” menunjukkan yang peka terhadap masa dan tempat membantu [3].
Anjakan beban kerja dalam masa
Jadualkan latihan/inferens kelompok berat untuk jam cekap air (malam yang lebih sejuk, keadaan grid yang menggalakkan) [3].
Tanya vendor anda untuk metrik telus
Permintaan air sejurus, definisi sempadan dan sama ada nombor termasuk kapasiti terbiar dan overhed kemudahan. Kumpulan dasar mendesak pendedahan mandatori untuk membuat perbandingan epal-ke-epal mungkin [3].
Teknologi penyejukan penting
Jika anda menjalankan perkakasan, nilaikan penyejukan gelung tertutup/terus ke cip; jika anda menggunakan awan, lebih suka rantau/penyedia yang melabur dalam reka bentuk cahaya air [4][5].
Gunakan pilihan air kelabu dan guna semula
Banyak kampus boleh menggantikan sumber yang tidak boleh diminum atau mengitar semula dalam gelung; operator besar menerangkan sumber air mengimbangi dan pilihan penyejukan untuk meminimumkan impak bersih [5].

Contoh ringkas untuk menjadikannya nyata (bukan peraturan universal): memindahkan kerja latihan semalaman dari kawasan panas dan kering pada pertengahan musim panas ke kawasan yang lebih sejuk dan lembap pada musim bunga - dan menjalankannya semasa waktu luar puncak dan sejuk - boleh mengubah di tapak dan di luar tapak . Itulah jenis penjadualan kemenangan yang praktikal dan dramatik yang boleh diwujudkan [3].

Jadual perbandingan: pilihan pantas untuk menurunkan tol air AI 🧰

alat	penonton	harga	mengapa ia berfungsi
Model yang lebih kecil, disesuaikan dengan tugas	Pasukan ML, petunjuk produk	Rendah–sederhana	Kurang pengiraan setiap token = kurang penyejukan + air elektrik; terbukti dalam pelaporan gaya LCA [2].
Pemilihan wilayah mengikut air/kWj	Arkitek awan, perolehan	Sederhana	Beralih kepada iklim dan grid yang lebih sejuk dengan keamatan air yang lebih rendah; berpasangan dengan penghalaan sedar permintaan [3].
Tetingkap latihan masa dalam sehari	MLOps, penjadual	Rendah	Malam yang lebih sejuk + keadaan grid yang lebih baik mengurangkan keamatan air yang berkesan [3].
Penyejukan terus-ke-cip/gelung tertutup	Operasi pusat data	Med–tinggi	Elakkan menara penyejat jika boleh, mengurangkan penggunaan di tapak [4].
Kawalan panjang & kumpulan segera	Pembangun apl	Rendah	Hadkan token pelarian, kumpulan dengan bijak, keputusan cache; kurang milisaat, lebih sedikit mililiter [1][2].
Senarai semak ketelusan vendor	CTO, petunjuk kemampanan	Percuma	Memaksa kejelasan sempadan (di tapak vs luar tapak) dan pelaporan epal-ke-epal [3].
Air kelabu atau sumber tebus guna	Kemudahan, majlis perbandaran	Sederhana	Menggantikan air tidak boleh diminum melegakan tekanan pada bekalan boleh diminum [5].
Perkongsian guna semula haba	Pengendali, majlis tempatan	Sederhana	Kecekapan haba yang lebih baik secara tidak langsung mengurangkan permintaan penyejukan dan membina muhibah tempatan [5].

(“Harga” adalah licin mengikut reka bentuk - penggunaan berbeza-beza.)

Menyelam dalam: paluan dram polisi semakin kuat 🥁

Badan kejuruteraan menyeru pendedahan mandatori tenaga dan air pusat data supaya pembeli dan komuniti dapat menilai kos dan faedah. Cadangan termasuk definisi skop, pelaporan peringkat tapak dan panduan penentuan lokasi - kerana tanpa metrik yang setanding dan peka lokasi, kita berhujah dalam kegelapan [3].

Menyelam dalam: pusat data tidak semuanya menyedut dengan cara yang sama 🚰

Terdapat mitos yang berterusan bahawa "penyejukan udara tidak menggunakan air." Tidak juga. Sistem berat udara selalunya memerlukan lebih banyak elektrik, yang di banyak kawasan membawa air tersembunyi dari grid; sebaliknya, penyejukan air boleh mengurangkan kuasa dan pelepasan dengan kos air di tapak. Pengendali besar secara eksplisit mengimbangi pertukaran ini dari tapak ke tapak [1][5].

Penyelaman mendalam: semakan realiti pantas pada dakwaan viral 🧪

Anda mungkin pernah melihat kenyataan berani bahawa satu gesaan bersamaan dengan "sebotol air," atau, di hujung yang lain, "hanya beberapa titis." Postur yang lebih baik: kerendahan hati dengan matematik . Hujung buku yang boleh dipercayai hari ini ialah ~0.26 mL untuk gesaan pengeluaran median dengan overhed hidangan penuh [1] dan ~45 mL untuk balasan pembantu 400 token (inferens marginal) [2]. Dakwaan "satu perlima belas sudu teh" yang banyak dikongsi tidak mempunyai sempadan/kaedah awam; anggap ia seperti ramalan cuaca tanpa bandar [1][3].

Soalan Lazim Mini: Berapa banyak air yang digunakan oleh AI? sekali lagi, dalam bahasa Inggeris biasa 🗣️

Jadi, apa yang perlu saya katakan dalam mesyuarat?
“Setiap gesaan, ia terdiri daripada titisan hingga beberapa teguk, bergantung pada model, tempoh dan tempat ia dijalankan. Latihan mengambil masa yang terhad, bukan lopak.” Kemudian, sebutkan satu atau dua contoh di atas.
Adakah AI sangat teruk?
Ia tertumpu: cip berkuasa tinggi yang disatukan menghasilkan beban penyejukan yang besar. Tetapi pusat data juga merupakan tempat teknologi kecekapan terbaik cenderung mendarat dahulu [1][4].
Bagaimana jika kita hanya memindahkan segala-galanya ke penyejukan udara?
Anda mungkin memotong di tapak tetapi menambah di luar tapak melalui elektrik. Pengendali canggih menimbang kedua-duanya [1][5].
Bagaimana pula dengan teknologi masa depan?
Reka bentuk yang mengelakkan air penyejuk pada skala akan menjadi penukar permainan untuk Skop 1. Sesetengah pengendali bergerak dengan cara ini; elektrik hulu masih membawa isyarat air sehingga grid berubah [4].

Catatan Akhir - Terlalu Panjang, Saya Tidak Membacanya 🌊

Setiap gesaan: fikirkan sub-mililiter hingga berpuluh-puluh mililiter, bergantung pada model, panjang gesaan dan tempat ia dijalankan. Gesaan median ~0.26 mL pada satu timbunan utama; ~45 mL untuk balasan 400 token pada yang lain [1][2].
Latihan: berjuta-juta liter untuk model frontier, menjadikan penjadualan, penempatan dan teknologi penyejukan penting [3].
Perkara yang perlu dilakukan: model bersaiz betul, pilih kawasan bijak air, alihkan kerja berat kepada waktu yang lebih sejuk, lebih suka vendor yang membuktikan reka bentuk cahaya air dan menuntut sempadan yang telus [1][3][4][5].

Metafora yang cacat sedikit untuk berakhir: AI ialah orkestra yang dahaga - melodinya dikira, tetapi gendangnya menyejukkan dan air grid. Tarik band, dan penonton masih mendapat muzik tanpa perenjis berbunyi. 🎻💦

Rujukan

Blog Awan Google - Berapa banyak tenaga yang digunakan oleh AI Google? Kami telah melakukan pengiraan (metodologi + ~0.26 mL median gesaan, overhead hidangan penuh). Pautan
(PDF kertas teknikal: Mengukur impak alam sekitar daripada penyampaian AI pada skala Google.) Pautan
Mistral AI - Sumbangan kami kepada piawaian alam sekitar global untuk AI (LCA dengan ADEME/Carbone 4; ~281,000 m³ + penggunaan awal; ~45 mL setiap 400-token , inferens marginal). Pautan
Li dkk. - Menjadikan AI Kurang “Dahaus”: Membongkar dan Menangani Jejak Air Rahsia Model AI (melatih berjuta-juta liter, yang peka masa dan tempat , pengeluaran vs. penggunaan). Pautan
Microsoft - Pusat data generasi akan datang menggunakan air sifar untuk penyejukan (reka bentuk terus ke cip menyasarkan penyejukan tanpa air di tapak tertentu). Pautan
Pusat Data Google - Beroperasi secara mampan (pertimbangan penyejukan tapak demi tapak; pelaporan dan penggunaan semula, termasuk tebus guna/air kelabu; susunan magnitud penggunaan peringkat tapak harian biasa). Pautan

Cari AI Terkini di Kedai Pembantu AI Rasmi

Tentang Kami

Kembali ke blog