
Kuasa pengkomputeran terbiar di sekeliling kita
Jadual kandungan
Kadang-kadang persoalan infrastruktur yang besar bermula dengan gambaran yang sangat kecil: sebuah telefon pintar berada di pengecas pada waktu malam. Laptop tertutup. Konsol permainan menunggu di ruang tamu. Kereta terletak di garaj. Di mana-mana ada kuasa pengkomputeran yang sudah dibayar, mendapat elektrik, dan kebanyakannya tidak melakukan apa-apa.
Pada masa yang sama, pusat data baharu muncul, sebesar kemudahan industri. Dewan penuh GPU, gentian optik, transformer, sistem penyejukan dan kontrak elektrik. Kita sedang membina satu lapisan baharu infrastruktur digital yang akan menyokong cara kita menulis, mencari, memprogram, menganalisis dan mungkin suatu hari nanti membuat keputusan.
Bagaimana jika sebahagian kecil kuasa ini tidak sekadar luput begitu sahaja? Bukan sebagai fantasi liar bahawa setiap telefon tiba-tiba menggantikan pusat data. Tetapi sebagai eksperimen pemikiran yang serius: mungkinkah ada sejenis grid pintar compute, di mana peranti secara sukarela, terhad dan diberi ganjaran menyumbang kuasa pengkomputeran?
Dalam artikel Daripada PRISM kepada Prompt saya melihat sisi lain perkembangan ini: pergantungan yang semakin meningkat kepada beberapa platform AI sahaja, terutamanya dari Amerika Syarikat dan China. Di sini saya berminat pada idea lawannya. Bukan sebagai romantik P2P yang naif, tetapi sebagai persoalan teknikal: berapa banyak kuasa pengkomputeran sebenarnya sudah tersebar, tugas AI mana yang boleh diagihkan, dan apa yang perlu berlaku supaya manusia dibayar secara adil untuknya?
Kuasa pengkomputeran tidak boleh disimpan. Satu jam GPU yang tidak digunakan bukan simpanan. Ia hilang begitu sahaja.
Eksperimen pemikiran
AI bukan sekadar perisian. AI ialah elektrik, penyejukan, gentian optik, GPU, tanah, air dan modal. Agensi Tenaga Antarabangsa menganggarkan pusat data di seluruh dunia menggunakan kira-kira 415 TWh elektrik pada 2024, sekitar 1.5 peratus daripada penggunaan elektrik global. Menjelang 2030, angka itu boleh menjadi sekitar 945 TWh.
Itu bukan sekadar angka untuk laporan kelestarian. Itu soal politik infrastruktur. Perkhidmatan AI tersedia 7x24. Setiap ringkasan, setiap soalan kod, setiap imej, setiap larian agen ialah pengiraan. Dan apabila berbilion manusia dan syarikat memasukkan kerja ke dalam gelung AI, ia menjadi beban dasar.
Sebab itu saya faham tarikan penyelesaian pusat yang besar. Pusat data boleh dikawal: perkakasan sama, rak sama, rangkaian sama, zon keselamatan jelas, SLA, pemantauan, pengebilan. Dari sudut operasi, itu menarik. Tetapi secara politik, ekonomi dan seni bina, ia sekali lagi menghasilkan perkara yang selalu membuat internet rapuh: beberapa pusat kuasa.
Eksperimen pemikiran ini bermula dengan soalan balas yang mudah: apa yang sudah tersedia sebelum kita membina pusat data seterusnya?
Seberapa besar kapasiti terbiar itu?
Idea ini sebenarnya muncul daripada momen harian. Telefon pintar berada di meja sisi katil pada waktu malam, disambungkan kepada elektrik dan hampir tidak melakukan apa-apa. Tetapi di dalamnya ada cip dengan kuasa pengkomputeran khusus AI yang lebih besar daripada pakej keseluruhan banyak komputer sepuluh tahun lalu. iPhone 15 Pro dengan A17 Pro mencapai sekitar 35 trilion operasi Neural Engine sesaat. Walaupun kita hanya mengambil purata berhati-hati, itu jumlah yang tidak masuk akal untuk peranti yang menunggu hampir sepanjang malam.
Perkara sama berlaku di meja kerja. Notebook baharu bukan lagi hanya mempunyai CPU dan GPU, tetapi juga NPU atau Neural Engine. Apple sudah bertahun-tahun meletakkan Neural Engine dalam cipnya. Notebook Windows hadir sebagai AI PC dengan pemproses AI khusus. Konsol permainan di ruang tamu mempunyai kuasa GPU yang dahulu kedengaran seperti workstation. Namun kita biasanya menggunakan kuasa pengkomputeran tempatan ini hanya dalam lonjakan singkat: permainan, eksport, panggilan video, kesan tempatan, carian. Selepas itu peranti kembali melahu.
Di sinilah eksperimen pemikiran bermula. Bukan: “bolehkah saya menyewakan iPhone saya sebagai pusat data esok?” Itu karut. Tetapi: jika begitu banyak silikon sudah dibayar, disambungkan dan setiap malam menerima elektrik, sebesar mana kapasiti teorinya jika hanya jendela masa kecil, selamat dan sesuai boleh digunakan?
Kita tidak boleh mengukur kuasa pengkomputeran terbiar di dunia secara tepat. Terlalu banyak peranti berbeza, terlalu banyak yang offline, terlalu banyak yang tidak boleh turut serta kerana bateri, haba, keselamatan atau sebab platform. Namun anggaran kasar membantu memberi gambaran skala.
Untuk itu, mari ambil beberapa blok yang sengaja dipermudahkan. Penting: saya tidak mengira seolah-olah setiap peranti tersedia penuh setiap masa. Saya mengira dengan jendela masa, kadar penyertaan dan potongan berhati-hati. Ia tetap eksperimen pemikiran, tetapi berpijak pada angka.
Tesla: silikon di atas roda
Tesla melaporkan kenderaan ke-8 juta yang dihasilkannya pada Jun 2025. Bukan semuanya masih aktif, bukan semuanya mempunyai perkakasan Autopilot yang sama, dan bukan setiap pemilik akan membuka keretanya untuk rangkaian pengkomputeran. Jadi saya mengira secara konservatif:
- Daripada 8 juta kenderaan yang dihasilkan, mungkin 80 peratus masih aktif secara realistik dan relevan dari segi teknikal. Itu ialah 6.4 juta kenderaan.
- Untuk Hardware 3, iaitu FSD Computer sejak 2019, angka sekitar 144 TOPS untuk sistem sering disebut.
- Hardware 4 berada dalam kenderaan yang lebih baharu dan lebih moden, tetapi Tesla tidak menerbitkan nilai TOPS yang bersih dan mudah seperti angka Autonomy Day yang lama. Untuk kiraan ini, saya tetap mengambil 144 TOPS sebagai nilai asas konservatif.
- Sebuah kereta memang sering berhenti 23 jam sehari, tetapi jendela pengecasan ialah bahagian yang benar-benar menarik. Jika ia disambungkan kepada elektrik selama 6.5 jam pada waktu malam, itu bersamaan kira-kira 27 peratus ketersediaan secara purata atas 24 jam.
Jika hanya 25 peratus pemilik Tesla aktif ini mendaftar, itu ialah 1.6 juta kenderaan dan sekitar 62 exa-operasi sesaat sebagai ekuivalen harian. Pada penyertaan 50 peratus, angkanya sekitar 125 exa-operasi sesaat. Jika secara teori semua kenderaan aktif turut serta, angkanya sekitar 250 exa-operasi sesaat. Dalam jendela malam itu sendiri, kuasa seketika lebih tinggi; angka ekuivalen harian hanyalah perbandingan yang lebih adil dengan pusat data yang berjalan 24 jam.
iPhone: kejutan yang lebih besar
Untuk iPhone, kiraannya lebih mudah dan lebih sukar pada masa yang sama. Mudah kerana Apple menghantar jumlah yang sangat besar setiap tahun. Sukar kerana Apple tidak menyediakan jadual awam yang bersih tentang generasi iPhone mana yang masih aktif di seluruh dunia. Jadi saya mengambil shipment yang diterbitkan beberapa tahun kebelakangan ini dan meletakkan kadar aktif yang munasabah di atasnya.
| Tahun | iPhone yang dihantar | campuran cip kasar | anggaran kadar aktif | prestasi purata Neural Engine |
|---|---|---|---|---|
| 2021 | 235.7 juta | A14/A15 | 55 % | 12 TOPS |
| 2022 | 226.4 juta | A15/A16 | 65 % | 16 TOPS |
| 2023 | 234.6 juta | A16/A17 Pro | 75 % | 22 TOPS |
| 2024 | 233.1 juta | A16/A17/A18 | 85 % | 30 TOPS |
| 2025 | 247.8 juta | A18/A19 | 95 % | 32 TOPS |
Kiraan campuran ini menghasilkan sekitar 885 juta iPhone yang mungkin masih aktif daripada hanya lima tahun penghantaran. Itu bukan keseluruhan pangkalan iPhone aktif, tetapi potongan yang sengaja terhad. Generasi A14/A15 yang lebih lama berada pada julat TOPS dua digit rendah, A16 hampir 17 TOPS, A17 Pro sekitar 35 TOPS. Sebab itu purata setiap tahun lebih masuk akal daripada berpura-pura semua peranti mempunyai cip yang sama.
Sekarang permainan yang sama: 6.5 jam pada waktu malam ketika disambungkan kepada elektrik, bukan sepanjang hari. Jika 25 peratus peranti ini turut serta, kita mendapat sekitar 1'437 exa-operasi sesaat sebagai ekuivalen harian. Pada penyertaan 50 peratus, angkanya sekitar 2'875 exa-operasi sesaat. Jika secara teori semua peranti turut serta, angkanya sekitar 5'750 exa-operasi sesaat.
Itu kedengaran gila. Tetapi itulah maksudnya. Bukan kerana iPhone ialah pelayan. Tetapi kerana jumlah peranti begitu besar sehingga kadar yang berhati-hati pun tiba-tiba masuk ke skala yang biasanya kita percayakan kepada pusat data.
Perbandingan
Sebagai titik rujukan lain, saya ambil:
- 50 juta GPU desktop, workstation atau pelayan kecil yang secara purata boleh memberi 20 TFLOPS FP32. Jika hanya 20 peratus boleh digunakan secara praktikal, masih ada sekitar 200 exa-operasi sesaat dalam jendela masa yang sesuai.
- xAI Colossus sebagai perbandingan dari dunia pusat data. Dengan 200'000 GPU Hopper dan sekitar 3'958 INT8-TOPS bagi kelas H100, kita mendapat kira-kira 792 exa-operasi sesaat kuasa puncak AI teori. Itu ialah peak sparsity; prestasi padat dan boleh digunakan secara berterusan lebih rendah.
Anggaran kasar exa-operasi sesaat, dipuratakan sepanjang 24 jam. Tesla dan iPhone dikira dengan jendela malam 6.5 jam; untuk Tesla dan iPhone, grafik menunjukkan kadar penyertaan teori, bukan kapasiti yang tersedia hari ini.
Penting: ini bukan benchmark. FP32-FLOPS, INT8-TOPS dan Neural-Engine-TOPS tidak boleh ditukar 1:1. Memori, interconnect, perisian, pengesahan, kecekapan tenaga, hak platform dan penggunaan sebenar menentukan sama ada kuasa puncak boleh menjadi kerja berguna.
Ini bukan kapasiti global yang tepat. Ini model pemikiran. Dan di sinilah kita perlu berhenti sebentar: TOPS tidak boleh sekadar dituangkan seperti liter air ke dalam kolam bersama. Neural-Engine-TOPS sebuah iPhone, INT8-TOPS sebuah GPU dan prestasi FP32 sebuah workstation ialah perkara yang berbeza. Banyak kerja yang masuk akal memerlukan bukan sahaja operasi pengiraan, tetapi RAM, VRAM, lebar jalur memori, runtime stabil, akses perisian dan sistem operasi yang membenarkan kerja seperti itu.
Namun kiraan ini menunjukkan mengapa idea ini bukan sesuatu yang mengarut. Gabungan konservatif PC, kenderaan dan telefon pintar sahaja, sebagai silikon teori, mencapai skala yang tidak lagi kelihatan amat kecil di sebelah salah satu pusat pengkomputeran AI paling menonjol di dunia.
Angka iPhone sangat menarik kerana ia hanya melihat lima tahun penghantaran, bukan keseluruhan pangkalan terpasang yang aktif. Pada masa yang sama, ia contoh terbaik mengapa kuasa puncak tidak mencukupi: iPhone bukan pelayan. Ia ada had haba, logik bateri, peraturan sistem operasi, model privasi dan pemilik yang mengharapkan peranti berfungsi pada waktu pagi. Namun di situ ada kuasa pengkomputeran yang beberapa tahun lalu kedengaran seperti fiksyen sains.
Dan nilai puncak ini pun hanya nilai puncak. Telefon pintar, notebook tanpa kipas atau unit kawalan kereta tidak boleh begitu sahaja memberi prestasi itu selama enam jam seperti GPU pusat data. Haba, throttling dan logik perlindungan menekan prestasi berterusan dengan besar. Sesiapa yang mahu membina rangkaian sebenar daripada ini perlu mengira prestasi berterusan, bukan angka paling cantik pada helaian spesifikasi.
Kita juga boleh memikirkannya melalui elektrik. Jika 50 juta peranti menyumbang purata 150 watt selama empat jam sehari, itu sekitar 11 TWh setahun. Itu hanya sebahagian kecil daripada penggunaan pusat data global hari ini. Tetapi ia cukup untuk menyokong banyak kerja latar belakang, embeddings, workload saintifik, rendering, tugas pengesahan atau proses storan terdesentralisasi.
Bantahan yang tidak selesa ialah: ini tidak automatik lebih cekap. Pusat data mempunyai penyejukan lebih baik, penggunaan lebih baik, elektrik lebih murah, perkakasan lebih baharu dan batching profesional. Peranti rumah boleh menjadi lebih buruk bagi setiap kerja pengiraan berguna, terutama apabila banyak overhead wujud atau apabila bateri telefon pintar menjadi tua lebih cepat demi beberapa sen kredit. Grid compute terdesentralisasi tidak menjadi baik hanya kerana ia tersebar. Ia perlu masuk akal untuk workload yang sesuai: secara teknikal, tenaga dan ekonomi.
Ia menjadi lebih menarik dengan AI PC baharu. Canalys menjangka sekitar 100 juta AI PC dihantar pada 2025. Banyak peranti ini membawa NPU dengan 40 TOPS atau lebih. TOPS tidak sama dengan GPU-FLOPS, dan NPU tidak menggantikan pusat data. Tetapi walaupun kita melihat kuasa ini dengan sangat berhati-hati, satu kelas baharu perkakasan AI tempatan muncul, bukan hanya di atas kertas, tetapi di pejabat dan rumah.
Jadi maksudnya bukan: “esok kita menggantikan semua pusat data dengan PC gaming, Tesla dan iPhone.” Maksudnya ialah: kita membina kapasiti pusat yang sangat besar, sementara pada masa yang sama sejumlah besar kapasiti teragih yang sudah dibayar dibiarkan luput tanpa digunakan.
Kuasa pengkomputeran luput
Elektrik boleh saya simpan. Tidak sempurna, tidak tanpa kehilangan, tetapi pada asasnya boleh. Jika sistem solar saya menghasilkan lebih banyak daripada yang saya perlukan pada tengah hari, tenaga masuk ke bateri atau grid. Pada waktu malam saya boleh menggunakannya semula, atau jiran saya menggunakannya. Smart grid, storan bateri dan model tenaga peer-to-peer menjadikan cara berfikir ini semakin konkrit: kadang-kadang saya menghasilkan, kadang-kadang saya menggunakan, dan sempadan antara pelanggan dan penyedia menjadi lebih lembut.
Kuasa pengkomputeran berfungsi secara berbeza.
Satu jam GPU yang tidak digunakan semalam tidak boleh saya keluarkan dari laci hari ini. Pemproses yang tidak melakukan apa-apa sepanjang malam tidak menyimpan pengiraan untuk kemudian. Masa itu hilang. Tidak kembali. Compute itu mudah luput.
Itulah yang menjadikan peranti terbiar menarik. Kita bukan hanya mempunyai perkakasan. Kita mempunyai peluang yang sentiasa luput. Pool jangka pendek yang realistik terutamanya ialah GPU desktop, workstation, konsol permainan, pelayan kecil, storan NAS dan sumber kampus atau penyedia. Telefon pintar dan kereta lebih kepada kes pinggir jangka panjang: menarik dari segi teknikal, tetapi jauh lebih sukar kerana bateri, haba, peraturan platform, keselamatan dan kawalan pengeluar.
Jadi ia gagal bukan sahaja kerana matematik, tetapi juga kerana insentif. Peranti dengan silikon terbiar paling menarik sebenarnya milik platform tertutup: Apple membina infrastruktur Private Cloud Compute sendiri untuk permintaan Apple Intelligence yang besar, Tesla dengan Cortex membina kapasiti training sendiri untuk FSD dan Optimus. Mengapa syarikat seperti ini harus membuka armada peranti mereka untuk pasaran compute bebas pengeluar, jika kawalan ke atas perkakasan, perisian dan cloud ialah parit pertahanan sebenar?
Namun soalan asas kekal: mengapa kita melayan kuasa pengkomputeran teragih seolah-olah tidak relevan, sementara pada masa yang sama kita membina kemudahan pusat yang semakin besar?
Bolehkah AI dikira secara terdesentralisasi?
Di sini kita perlu jujur: untuk banyak perkara yang hari ini kelihatan sebagai AI, desentralisasi memang sukar.
Model bahasa besar bukan sekadar senarai tugas kecil yang boleh dilemparkan sesuka hati kepada peranti asing. Model memerlukan RAM atau VRAM. Model memerlukan lebar jalur memori. Sebahagiannya memerlukan interconnect pantas. Semasa penjanaan token, model dijalankan berulang kali, dan setiap lompatan rangkaian tambahan membuat respons lebih lambat. Memecahkan model frontier merentasi telefon pintar asing, laptop lama dan kereta untuk jawapan chat interaktif biasanya tidak masuk akal.
Tetapi itu tidak bermakna AI terdesentralisasi mustahil. Ia hanya bermakna kita perlu memilih tugas yang betul.
Yang sangat sesuai ialah kerja yang tidak perlu selesai dalam dua saat: embeddings untuk arkib besar, ringkasan batch, rendering, simulasi saintifik, data sintetik, ujian, crawling, tugas pengesahan, pembaikan storan terdesentralisasi, model tempatan kecil, prapemprosesan dan tugas yang hasilnya boleh diperiksa atau dikira beberapa kali.
Secara praktikal, tugas perlu dipisahkan dengan jauh lebih bersih:
| Kelas kerja | Masuk akal secara terdesentralisasi? | Mengapa |
|---|---|---|
| Inferens tempatan peribadi | Ya, tetapi tempatan | Data kekal pada peranti sendiri atau ruang kepercayaan sendiri. |
| Inferens batch dan embeddings | Selalunya ya | Throughput lebih penting daripada latensi saat. |
| Subtugas boleh disahkan | Ya, jika boleh diperiksa | Hasil boleh dikira semula, diattest atau dikawal dengan ujian. |
| Storan dan replikasi | Ya, dengan peraturan | Penyulitan, erasure coding, audit dan mekanisme pembaikan ialah blok binaan yang dikenali. |
| Training frontier dan SLA keras | Cenderung tidak | Terlalu banyak gandingan, terlalu banyak VRAM, terlalu tinggi keperluan interconnect, operasi dan ketersediaan. |
Model besar juga tidak sepenuhnya mustahil, tetapi ia memerlukan seni bina lain. Petals menunjukkan bahawa inferens kolaboratif dan fine-tuning model besar melalui sumber teragih pada asasnya mungkin. Prime Intellect melangkah lebih jauh dengan INTELLECT-2 dan menunjukkan bagaimana reinforcement learning teragih dengan worker yang tidak dipercayai boleh berfungsi jika hasil disahkan. Ini belum dunia di mana iPhone kamu diam-diam melatih GPT-7 pada waktu malam. Tetapi ia petunjuk bahawa masalah ini tidak mustahil secara prinsip.
Permulaan yang realistik sebab itu bukan: “kita agihkan satu model raksasa merentasi semua benda.” Permulaan yang realistik ialah: model tempatan dahulu, pool serantau untuk batch job yang sesuai, tugas boleh disahkan, zon data jelas dan pusat data pusat hanya di tempat yang benar-benar perlu.
Mimpi lama sistem teragih
Ada naratif internet yang lain. Satu yang kurang berbunyi seperti katedral dan lebih seperti kawanan.
Pengkomputeran sukarela
SETI@home bagi saya sentiasa salah satu contoh paling indah. Jutaan orang membiarkan komputer mereka mengira data radioastronomi di latar belakang. Bukan kerana mereka mendapat dashboard SaaS, tetapi kerana idenya cukup besar: kita bersama-sama mencari isyarat dalam hingar alam semesta. Sejak Mac 2020 SETI@home tidak lagi mengagihkan Work Units baharu dan berada dalam semacam hibernation. Tetapi sebagai bukti bahawa pengkomputeran sukarela boleh berfungsi secara global, ia tetap penting.
BOINC, platform di belakang dan di sebelahnya, menjelaskan dengan kering mengapa ini berfungsi: banyak kerja bebas yang intensif pengiraan, di mana throughput lebih penting daripada latensi rendah. Itulah perbezaan penentu. Sistem teragih tidak perlu menghantar setiap jawapan chat interaktif dalam dua saat. Ia boleh kuat di tempat kerja boleh dipecah, diperiksa dan tidak perlu siap serta-merta.
Storan tanpa tempat tetap
IPFS membawa pemikiran yang sama ke ruang storan. Fail tidak terutama dialamatkan melalui lokasi, tetapi melalui kandungannya. Kandungan itu mempunyai cap jari. Sesiapa yang memilikinya boleh menghantarnya. Itu cara berfikir yang berbeza daripada “fail ini berada pada pelayan ini di URL ini”.
Wang tanpa buku kira-kira pusat
Bitcoin, sama sekali terpisah daripada bagaimana kita menilai spekulasi dan penggunaan tenaganya, mempopularkan idea asas yang serupa: sistem tanpa buku kira-kira pusat, di mana konsensus tidak bergantung pada satu institusi. Tidak setiap idea terdesentralisasi automatik baik. Tetapi Bitcoin menunjukkan bahawa protokol boleh menjadi kuat secara politik apabila ia membuang titik kawalan pusat.
Storan sebagai rangkaian
Dalam storan juga ada percubaan menarik. Symform ialah penyedia cloud storage terdesentralisasi di mana storan lebihan boleh dibawa masuk ke rangkaian. Pada 2014 platform itu diambil alih oleh Quantum; ketika itu disebut 45'000 pengguna dan syarikat kecil di 170 negara. Storj, Sia, Filecoin dan varian lain juga menunjukkan: idea ini bukan baharu. Ia cuma tidak pernah benar-benar sampai ke kehidupan harian.
Hari ini idea ini hidup dalam bentuk baharu. Storj memecahkan fail di sisi klien dalam keadaan disulitkan dan mengagihkan kepingan ke banyak Storage Nodes. Itu lebih dekat dengan infrastruktur daripada romantik: pengguna idealnya tidak melihat kawanan, tetapi perkhidmatan storan yang berfungsi.
Compute sebagai pasaran
Golem dan Akash mahu menjadikan kuasa pengkomputeran terbiar tersedia sebagai pasaran. Bagi saya, ini jambatan langsung kepada artikel ini: bukan hanya ruang storan yang tersebar, tetapi juga pemproses, GPU dan pelayan kecil yang hari ini sering tidak bekerja.
AI dalam kawanan teragih
Andrej Karpathy juga muncul semula dalam persekitaran ini: di Prime Intellect beliau disebut sebagai penyokong terkenal, dan Prime Intellect dengan INTELLECT-2 memulakan pusingan training RL teragih untuk model 32B parameter, di mana sumber pengkomputeran heterogen dan permissionless boleh menyumbang.
Itu belum jawapan sempurna. Tetapi ia menunjukkan: mimpi itu tidak hilang. Ia hanya terus mencari bentuk yang boleh bertahan dalam operasi sebenar.
Belajar daripada loji kuasa maya
Menariknya, cara berfikir ini dalam bidang elektrik sudah lama kedengaran kurang eksotik.
Tesla menerangkan Virtual Power Plant sebagai rangkaian sumber tenaga teragih: rumah dengan sistem solar dan Powerwall dilihat bersama-sama seperti sebuah loji kuasa. Apabila grid memerlukan sokongan, bateri boleh melepaskan elektrik. Pemilik menyediakan sumber dan menerima wang atau faedah lain. Powerwall individu kecil. Bersama-sama, ia boleh menjadi relevan untuk grid.
Itulah analogi yang membuat compute begitu menarik bagi saya. Satu GPU di home office, satu NAS, satu iPhone atau satu kereta bukan pusat data. Tetapi banyak peranti bersama-sama boleh membentuk lapisan baharu: bukan untuk semua perkara, bukan sepanjang masa, bukan tanpa peraturan, tetapi untuk tugas tertentu.
Analogi ini ada batas. Elektrik jauh lebih boleh ditukar ganti daripada kerja pengkomputeran. Satu kilowatt-jam tidak bergantung pada sama ada ia sedang menjalankan model dengan 80 GB VRAM, pipeline embedding atau pembaikan storan tersulit. Compute bergantung pada workload. Sebab itu ia memerlukan kelas job, scheduling dan pengecualian tegas.
Pada Tesla, kita melihat pemikiran sama di dua tempat. Powerwall boleh menjadi sebahagian daripada loji kuasa maya. Kereta pula diharapkan pada masa depan menjadi sebahagian daripada armada robotaxi autonomi, jadi menghasilkan wang ketika pemilik tidak menggunakannya sendiri. Sama ada dan seberapa cepat itu benar-benar berskala ialah soalan lain. Tetapi idea asasnya penting: peranti peribadi tidak lagi hanya digunakan sebagai konsumsi, tetapi boleh bekerja sebagai infrastruktur dalam jendela masa kosong.
Compute boleh difikirkan secara serupa. Bukan sebagai jualan elektrik kepada jiran, tetapi sebagai jualan masa pengkomputeran yang boleh disahkan, ruang storan atau kerja model kepada sel serantau. Pengguna akhirnya membayar elektrik, haba, kehausan perkakasan dan risiko. Jadi pengguna juga perlu diberi ganjaran. Tanpa titik ini, idea itu hanya menjadi eksperimen teknikal yang cantik.
Mengapa kawanan begitu jarang menang
Jika desentralisasi kedengaran begitu indah, mengapa ia tidak menang begitu sahaja?
Kerana pemusatan selalunya pakej produk yang lebih baik.
Pusat data boleh dikawal. Kawanan terdiri daripada peranti asing, sistem operasi berbeza, ketersediaan berubah-ubah, ramalan buruk dan pemilik yang mematikan, menjual, mengemas kini atau memutuskan peranti daripada rangkaian. Bagi product manager, itu bukan romantik, tetapi sakit kepala.
Ditambah pula ekonomi. Banyak projek terdesentralisasi cuba menyelesaikan insentif melalui token. Itu boleh difahami, kerana rangkaian tanpa syarikat pusat tetap memerlukan ganjaran. Tetapi sebaik sahaja kos storan atau masa pengkomputeran dikaitkan dengan mata wang volatile, ia menjadi tidak menarik untuk syarikat biasa. Saya tidak mahu terabyte backup saya tiba-tiba menjadi lebih mahal kerana satu coin dipam di Twitter. Saya juga tidak mahu bajet jam GPU saya bergantung pada pasaran yang lebih terasa seperti kasino daripada infrastruktur.
Dan lawan harga bukan GPU on-demand paling mahal di cloud. Perbandingan sebenar ialah tawaran spot dan preemptible, iaitu kapasiti pusat data berlebihan yang dijual penyedia dengan diskaun besar. Rangkaian compute terdesentralisasi perlu bukan sahaja lebih cantik dari segi falsafah. Ia perlu bersaing dengan kapasiti cloud yang sangat murah, terintegrasi baik, walaupun boleh dihentikan.
Brek kedua ialah keselesaan. S3 tidak menang kerana ia indah secara falsafah. Ia menang kerana ia cukup mudah, cukup didokumentasikan dan terintegrasi di mana-mana. Jika rangkaian storan atau compute terdesentralisasi mahu relevan, ia perlu terasa hampir membosankan untuk pembangun dan admin: masukkan API key, buat bucket, pemantauan, bil, SLA, ujian restore, selesai.
Kemudian datang keselamatan. Dalam rangkaian perusahaan, tidak patut tiba-tiba ada compute job asing masuk ke workstation. Firewall yang waras akan menyekatnya dan sistem threat intelligence akan melihatnya mencurigakan. Secara praktikal, sistem seperti itu perlu bekerja dari dalam ke luar: node melapor kepada sel, mengambil job yang diperiksa, berjalan dalam sandbox dan hanya melihat data yang dibenarkan. Jika tidak, rangkaian compute yang sah pada tahap rangkaian cepat kelihatan seperti botnet yang sangat sopan.
Kepercayaan ialah titik keras seterusnya. Sistem terdesentralisasi perlu membuktikan bahawa kerja dilakukan dengan betul tanpa setiap node boleh melihat semuanya. Dalam storan ada blok binaan yang dikenali: penyulitan, erasure coding, audit, mekanisme pembaikan. Dalam AI dan compute, ia lebih sukar. Bagaimana saya memeriksa sama ada peranti asing menjalankan model dengan betul? Bagaimana saya mencegah kebocoran data? Bagaimana saya melindungi peranti peserta daripada kod asing?
Kehausan perkakasan juga lebih daripada elektrik. SSD dan storan NVMe mempunyai had tulis. Sesiapa yang sentiasa menulis berat model, data sementara, batch embedding atau fail swap pada peranti pengguna menggunakan jangka hayat sebenar. Ditambah masalah lebar jalur: jika muat turun model atau dataset besar mengambil masa lebih lama dan menghasilkan overhead rangkaian lebih besar daripada pengiraan sebenar, kiraannya terbalik. Data lebih berat daripada yang disangka oleh metafora smart grid yang mudah.
Di sinilah INTELLECT-2 menjadi menarik. Dalam papernya, Prime Intellect menerangkan TOPLOC sebagai blok binaan yang mengesahkan rollout daripada Inference Worker yang tidak dipercayai. Ia tidak tiba-tiba menyelesaikan semua masalah compute. Ia bukan perlindungan data ajaib untuk apa-apa data syarikat pada hardware asing. Tetapi ia menunjukkan mekanisme sebenar untuk kelas kerja AI teragih tertentu: job dibina supaya hasil boleh diperiksa, bukannya setiap worker dipercayai secara buta.
Untuk data sulit, itu sahaja tidak cukup. Di situ perlu blok lain: Confidential Computing, Trusted Execution Environments, Remote Attestation, sandbox bersih, klasifikasi data jelas dan, jika perlu, keputusan tegas bahawa job tertentu langsung tidak boleh berjalan pada hardware asing. Turut datang soalan membosankan tetapi penting: cukai, liabiliti, perlindungan data, residensi data dan terma ISP. Infrastruktur jarang gagal hanya kerana matematik. Selalunya ia gagal kerana operasi.
Compute smart grid
Saya tidak membayangkan “semuanya P2P lalu semuanya menjadi baik” yang naif. Infrastruktur tidak berfungsi begitu. Yang mungkin berfungsi ialah grid pintar compute dengan lapisan jelas.
Lapisan pertama ialah: tempatan dahulu. Semua yang peribadi, sulit atau kritikal terhadap latensi sebaiknya berjalan pada peranti sendiri atau ruang kepercayaan sendiri jika boleh. Model kecil, carian tempatan, ringkasan peribadi, klasifikasi mudah, prapemprosesan, penyulitan, embeddings untuk data peribadi. Tidak setiap e-mel, setiap nota dan setiap carian perlu pergi kepada hyperscaler.
Lapisan kedua ialah serantau dan berfederasi. Sebuah bandar, kejiranan, kampus, syarikat, koperasi atau penyedia boleh mengendalikan satu sel. Dalam sel ini, peranti menyediakan sumber secara sukarela, tetapi hanya dengan syarat jelas: hanya ketika disambungkan kepada elektrik, hanya ketika melahu, hanya dalam had terma, hanya dengan kuasa maksimum yang ditentukan, hanya untuk kelas job tertentu.
Titik mula bukan telefon pintar dan kereta, tetapi peranti yang lebih membosankan: GPU desktop, workstation, konsol permainan, pelayan kecil, sistem NAS dan kapasiti bebas di penyedia tempatan. Telefon pintar kemudian boleh mengambil job pengesahan kecil. Kereta mungkin difikirkan kemudian lagi, dalam had yang sangat sempit dan dikawal pengeluar. Sama seperti grid elektrik, kita perlu bermula dengan sumber yang boleh dipercayai, diukur dan dikawal.
Lapisan ketiga kekal pusat. Training frontier, real-time keras, model sangat besar, kes khas yang sensitif secara regulasi dan workload dengan gandingan tinggi tetap berada dalam pusat data profesional. Desentralisasi tidak perlu menggantikan semuanya. Ia hanya perlu mencegah setiap kerja harian secara automatik melalui lima pusat kuasa yang sama.
Jika mahu mengujinya, saya akan mula kecil. Bukan dengan jutaan iPhone, tetapi dengan sel serantau mungkin 500 hingga 2'000 GPU desktop sukarela, workstation, sistem NAS dan pelayan kecil. Job yang dibenarkan hanya beberapa: embeddings untuk data tidak sensitif, batch job saintifik, kepingan storan tersulit dan tugas pengesahan. Kejayaan tidak diukur dengan angka exa yang cantik, tetapi dengan tiga metrik membosankan: job selesai bagi setiap $1 kos elektrik, kadar ralat dan ulang kira, ganjaran selepas kehausan perkakasan.
Bahagian paling sukar ialah ganjaran. Pengguna membayar elektrik, haba dan kehausan perkakasan. Jadi dia perlu mendapat sesuatu kembali. Mungkin memang perlu token atau kredit. Tetapi bukan sebagai objek spekulasi, sebaliknya sebagai kredit infrastruktur.
Compute-credit seperti itu perlu berdiri atas sesuatu yang nyata: satu minit GPU kelas tertentu, satu GB-bulan storan, satu inferens disahkan, satu unit batch embedding atau satu unit pengiraan setara kWh. Sesiapa yang memberi sumber mendapat kredit. Sesiapa yang kemudian memerlukan kuasa AI menggunakan kredit itu. Sesiapa yang tidak mahu menggunakannya boleh menukarkannya kepada fiat, sama seperti dalam loji kuasa maya orang tidak mahu dibayar dengan “Powerwall-Coins”, tetapi dengan wang sebenar atau kredit yang jelas.
Namun itu tidak menyelesaikan soalan harga secara ajaib. Kestabilan memerlukan sauh: pengebilan fiat, koridor harga tenaga, pusat clearing serantau, tarif koperasi atau operator dikawal selia. Tanpa governance, “kredit stabil” cepat menjadi token yang terapung bebas. Dan kita kembali kepada masalah lama: infrastruktur terasa seperti kasino.
Lebih penting lagi ialah soalan hak operasi. Kita tidak perlu melatih setiap foundation model besar sendiri. Mungkin kita membeli atau melesenkan model, open weights atau keluarga model dan kemudian mengendalikannya secara terdesentralisasi, berfederasi dan dikawal serantau. Kedaulatan sebenar bukan hanya dalam training, tetapi dalam operasi: Di mana model berjalan? Di mana data berada? Siapa boleh mengaudit? Adakah ada saluran balik kepada penyedia? Bolehkah saya terus menjalankan model secara tempatan jika politik, harga atau syarat berubah?
Supaya ini lebih daripada kontrak pembelian yang cantik, lesen seperti itu perlu memasukkan hak operasi sebenar: deployment tempatan, janji kemas kini dan keselamatan jangka panjang, model card yang boleh difahami, kebolehauditan, hak keluar yang jelas dan tiada kewajipan menolak data sensitif kembali ke cloud pusat pengeluar. Itu bukan utopia terdesentralisasi tulen. Tetapi ia jalan realistik antara sara diri naif dan platform lock-in total.
Malam ketika peranti mengira
Bayangkan pukul 22:43. Desktop kamu dengan GPU sedang melahu, NAS online, telefon mengecas. Dalam tetapan, kamu menetapkan: maksimum 80 watt, hanya ketika melahu, hanya untuk workload yang diperiksa dari rantau ini, dan hanya apabila ganjaran menutup kos elektrik serta elaun perkakasan.
Agen tempatan melaporkan kapasiti bebas. Bukan dengan nama kamu dan bukan dengan data peribadi kamu, tetapi sebagai node terattest dengan kebolehan tertentu. Sel mengagihkan job kecil: simulasi, embeddings, kepingan storan tersulit, tugas pengesahan.
Pada waktu pagi tidak ada roket, tidak ada cerita Wall Street, tidak ada hype token. Hanya satu baris tenang:
Malam ini: 2.4 GPU-credit diperoleh, 18 GB-bulan storan disahkan, $0.31 kos elektrik dianggarkan.
Kemudian kamu menggunakan kredit ini untuk model tempatan atas dokumen kamu sendiri. Data sensitif kekal dengan kamu. Kamu bukan hanya pelanggan. Kamu peserta.
Itu kedengaran romantik. Ya. Tetapi kadang-kadang itulah sebabnya satu masalah engineering yang sukar patut diambil serius.
Kawanan dan gunung
Saya tidak percaya pusat data pusat akan hilang. Ia terlalu cekap, terlalu penting dan untuk beberapa tugas memang perlu. Gunung itu kekal. Soalannya hanya sama ada kita membina tanah semula di sebelahnya.
Tanah daripada peranti tempatan, sel serantau, protokol terbuka, kredit stabil dan model keselamatan jelas. Tanah di mana kuasa pengkomputeran tidak hanya dijual dari atas ke bawah, tetapi mengalir antara peserta. Tanah di mana kerja AI tertentu berjalan di tempat yang sepatutnya: kerja peribadi secara tempatan, kerja serantau secara serantau, kes pinggir global di pusat data.
Mungkin itu naif. Mungkin juga tidak. Loji kuasa maya dahulu juga idea yang pelik: ribuan bateri kecil sebagai satu rangkaian besar. Wang terdesentralisasi lama kedengaran absurd. Kereta yang memandu sendiri sebagai teksi kedengaran seperti fiksyen sains. Tidak semuanya akan berlaku seperti dijanjikan. Tetapi arahnya jelas: sumber yang dahulu berdiri pasif semakin difikirkan sebagai sebahagian daripada sistem yang lebih besar.
Sekarang ini, mesin terbiar berada di mana-mana. Di rumah, pejabat, garaj, bilik pelayan dan poket. Tidak semuanya sama sesuai. Tidak semuanya patut pernah menjalankan kerja asing. Tetapi banyak sudah ada, sudah dibayar dan sudah disambungkan. Dan setiap saat yang tidak digunakan hilang.
Mungkin kita patut mula mendengar mereka.
Sehingga kali seterusnya,
Joe
Sumber
- IEA: Energy and AI, Executive Summary
- NVIDIA H100 Tensor Core GPU
- NVIDIA Developer: Confidential Computing on H100 GPUs
- AWS: Amazon EC2 Spot Instances
- Ars Technica: Tesla’s autonomy event and FSD computer
- Tesla Q2 2025 Update: 8-millionth vehicle
- Tesla Support: Virtual Power Plant
- Android Central: IDC 2021 smartphone shipments
- TASS: IDC 2022 smartphone shipments
- Gizmochina: IDC 2023 smartphone shipments
- IDC: Worldwide smartphone shipments 2025
- Tom’s Hardware: A15 Bionic Neural Engine
- Apple: A16 Bionic Neural Engine
- Notebookcheck: Apple A17 Pro NPU specs
- Tom’s Hardware: xAI Colossus reaches 200,000 GPUs
- Canalys: AI-capable PC shipments
- Apple Security Research: Private Cloud Compute
- TechCrunch: Tesla Dojo, Cortex and AI training compute
- IPFS: Building blocks for a better web
- Bitcoin whitepaper
- SETI@home hibernation announcement
- BOINC overview
- Quantum: Acquisition of Symform’s cloud services platform
- Storj Docs: Introduction to Storj
- Golem Network
- Akash Network: What is Akash?
- arXiv: Petals, collaborative inference and fine-tuning
- Prime Intellect: INTELLECT-2
- arXiv: INTELLECT-2 technical paper


