trueNetLab logo
ID
Daya komputasi yang tidak terpakai di sekitar kita

Daya komputasi yang tidak terpakai di sekitar kita

24 min read
Ai Network Security

Kadang pertanyaan infrastruktur besar dimulai dari gambar yang sangat kecil: sebuah smartphone tergeletak dan sedang diisi daya pada malam hari. Laptop tertutup. Konsol game menunggu di ruang tamu. Mobil berdiri di garasi. Di mana-mana ada daya komputasi yang sudah dibayar, mendapat listrik, dan sebagian besar waktunya tidak melakukan apa-apa.

Pada saat yang sama, pusat data baru bermunculan, sebesar fasilitas industri. Ruang-ruang besar berisi GPU, serat optik, transformator, teknologi pendingin, dan kontrak listrik. Kita sedang membangun lapisan baru infrastruktur digital yang akan menopang cara kita menulis, mencari, memprogram, menganalisis, dan mungkin suatu saat juga mengambil keputusan.

Bagaimana jika sebagian kecil dari daya ini tidak begitu saja berlalu sia-sia? Bukan sebagai fantasi liar bahwa setiap ponsel tiba-tiba menggantikan pusat data. Melainkan sebagai eksperimen pikiran yang serius: mungkinkah ada semacam smart grid komputasi, tempat perangkat secara sukarela, terbatas, dan berbayar menyumbangkan daya komputasi?

Dalam artikel Dari PRISM ke Prompt saya membahas sisi lain perkembangan ini: ketergantungan yang makin besar pada sedikit platform AI, terutama dari Amerika Serikat dan China. Di sini saya tertarik pada gagasan kebalikannya. Bukan sebagai romantisme P2P yang naif, melainkan sebagai pertanyaan teknis: berapa banyak daya komputasi yang sebenarnya sudah tersebar, tugas AI mana yang realistis dibagi, dan apa yang harus terjadi agar orang dibayar dengan adil untuk itu?

Daya komputasi tidak bisa disimpan. Satu jam GPU yang tidak terpakai bukan cadangan. Ia berlalu begitu saja.

Eksperimen pikiran

AI bukan sekadar perangkat lunak. AI adalah listrik, pendinginan, serat optik, GPU, tanah, air, dan modal. Badan Energi Internasional memperkirakan pusat data di seluruh dunia mengonsumsi sekitar 415 TWh listrik pada 2024, kira-kira 1,5 persen dari konsumsi listrik global. Pada 2030 angkanya bisa mencapai sekitar 945 TWh.

Itu bukan sekadar angka untuk laporan keberlanjutan. Itu politik infrastruktur. Layanan AI tersedia 7x24. Setiap rangkuman, setiap pertanyaan kode, setiap gambar, setiap proses agen adalah komputasi. Dan ketika miliaran orang dan perusahaan memasukkan pekerjaan ke dalam loop AI, hal itu menjadi beban dasar.

Karena itu saya memahami daya tarik solusi sentral yang besar. Pusat data bisa dikendalikan: perangkat keras seragam, rak seragam, jaringan seragam, zona keamanan jelas, SLA, monitoring, penagihan. Dari sisi operasi, itu menarik. Tetapi secara politik, ekonomi, dan arsitektur, pola ini kembali menciptakan hal yang selalu membuat internet rentan: sedikit pusat kekuasaan.

Eksperimen pikiran ini dimulai dengan pertanyaan balik yang sederhana: apa yang sudah ada sebelum kita membangun pusat data berikutnya?

Seberapa besar kapasitas yang tidak terpakai?

Gagasan ini sebenarnya muncul dari momen sehari-hari. Smartphone berada di meja samping tempat tidur pada malam hari, tersambung ke listrik, dan hampir tidak melakukan apa pun. Namun di dalamnya ada chip dengan daya komputasi khusus AI yang lebih besar daripada kemampuan total banyak komputer sepuluh tahun lalu. iPhone 15 Pro dengan A17 Pro mencapai sekitar 35 triliun operasi Neural Engine per detik. Bahkan jika kita hanya mengambil rata-rata yang hati-hati, itu jumlah yang absurd untuk perangkat yang sebagian besar malam hanya menunggu.

Hal yang sama terjadi di meja kerja. Notebook baru tidak lagi hanya memiliki CPU dan GPU, tetapi juga NPU atau Neural Engine. Apple sudah bertahun-tahun memasang Neural Engine di chipnya. Notebook Windows hadir sebagai AI PC dengan prosesor AI khusus. Konsol game di ruang tamu memiliki daya GPU yang dulu terdengar seperti workstation. Namun kita biasanya memakai daya komputasi lokal ini hanya dalam lonjakan singkat: sebuah game, ekspor video, video call, efek lokal, pencarian. Setelah itu perangkat kembali idle.

Di sinilah eksperimen pikiran dimulai. Bukan: “bisakah saya menyewakan iPhone saya sebagai pusat data besok?” Itu omong kosong. Melainkan: jika begitu banyak silikon sudah dibayar, terhubung, dan setiap malam mendapat listrik, sebesar apa kapasitas teoretisnya jika hanya jendela waktu kecil, aman, dan cocok yang dapat dimanfaatkan?

Kita tidak bisa mengukur daya komputasi dunia yang tidak terpakai secara persis. Terlalu banyak perangkat berbeda, terlalu banyak yang offline, terlalu banyak yang tidak boleh ikut karena alasan baterai, panas, keamanan, atau platform. Meski begitu, perkiraan kasar membantu memberi gambaran skalanya.

Untuk itu, mari ambil beberapa blok yang sengaja dibuat sederhana. Penting: saya tidak menghitung seolah-olah setiap perangkat selalu tersedia penuh. Saya memakai jendela waktu, tingkat partisipasi, dan pemotongan konservatif. Ini tetap eksperimen pikiran, tetapi dengan angka sebagai pijakan.

Tesla: silikon di atas roda

Tesla melaporkan kendaraan ke-8 juta yang diproduksi pada Juni 2025. Tidak semuanya masih aktif, tidak semuanya memiliki perangkat keras Autopilot yang sama, dan tidak semua pemilik akan mengizinkan mobilnya ikut jaringan komputasi. Jadi saya menghitung secara konservatif:

  • Dari 8 juta kendaraan yang diproduksi, mungkin 80 persen masih realistis aktif dan relevan secara teknis. Itu berarti 6,4 juta kendaraan.
  • Untuk Hardware 3, yaitu FSD Computer sejak 2019, sering disebut angka sekitar 144 TOPS untuk sistemnya.
  • Hardware 4 ada di kendaraan yang lebih baru dan lebih modern, tetapi Tesla tidak memublikasikan nilai TOPS yang bersih dan sederhana seperti angka Autonomy Day yang lebih lama. Jadi untuk perhitungan ini saya tetap memakai 144 TOPS sebagai nilai dasar konservatif.
  • Mobil memang sering diam 23 jam sehari, tetapi yang benar-benar menarik adalah jendela pengisian daya. Jika pada malam hari ia tersambung listrik selama 6,5 jam, rata-rata terhadap 24 jam itu berarti sekitar 27 persen ketersediaan.

Jika hanya 25 persen pemilik Tesla aktif ini ikut, itu berarti 1,6 juta kendaraan dan sekitar 62 exa-operasi per detik sebagai ekuivalen harian. Pada partisipasi 50 persen, angkanya sekitar 125 exa-operasi per detik. Jika secara teoretis semua kendaraan aktif ikut, angkanya sekitar 250 exa-operasi per detik. Di jendela malam itu sendiri daya sesaatnya lebih tinggi; angka ekuivalen harian hanya pembanding yang lebih adil dengan pusat data yang berjalan 24 jam.

iPhone: kejutan yang lebih besar

Untuk iPhone, hitungannya sekaligus lebih mudah dan lebih sulit. Mudah karena Apple mengirimkan perangkat dalam jumlah sangat besar setiap tahun. Sulit karena Apple tidak menyediakan tabel publik yang rapi tentang generasi iPhone mana yang masih aktif di seluruh dunia. Jadi saya mengambil angka pengiriman yang dipublikasikan beberapa tahun terakhir dan menambahkan perkiraan rasio aktif yang masuk akal.

TahuniPhone yang dikirimcampuran chip kasarasumsi rasio aktifrata-rata kinerja Neural Engine
2021235,7 jutaA14/A1555 %12 TOPS
2022226,4 jutaA15/A1665 %16 TOPS
2023234,6 jutaA16/A17 Pro75 %22 TOPS
2024233,1 jutaA16/A17/A1885 %30 TOPS
2025247,8 jutaA18/A1995 %32 TOPS

Perhitungan campuran ini menghasilkan sekitar 885 juta iPhone yang kemungkinan masih aktif hanya dari lima tahun pengiriman. Itu bukan seluruh basis iPhone aktif, melainkan potongan yang sengaja dibatasi. Generasi A14/A15 lama berada di kisaran TOPS belasan rendah, A16 hampir 17 TOPS, A17 Pro sekitar 35 TOPS. Karena itu rata-rata per tahun lebih masuk akal daripada berpura-pura semua perangkat memiliki chip yang sama.

Sekarang permainan yang sama lagi: 6,5 jam tersambung listrik pada malam hari, bukan sepanjang hari. Jika 25 persen perangkat ini ikut, kita mendapat sekitar 1'437 exa-operasi per detik sebagai ekuivalen harian. Pada partisipasi 50 persen, angkanya sekitar 2'875 exa-operasi per detik. Jika secara teoretis semua perangkat ikut, angkanya sekitar 5'750 exa-operasi per detik.

Itu terdengar gila. Tetapi justru itulah intinya. Bukan karena iPhone adalah server. Melainkan karena jumlah perangkatnya begitu besar sehingga kuota yang hati-hati pun tiba-tiba masuk ke skala yang biasanya kita kaitkan dengan pusat data.

Perbandingan

Sebagai titik pembanding lain, saya memakai:

  • 50 juta GPU desktop, workstation, atau server kecil yang rata-rata bisa memberi 20 TFLOPS FP32. Jika hanya 20 persen yang praktis bisa digunakan, masih tersisa sekitar 200 exa-operasi per detik dalam jendela waktu yang cocok.
  • xAI Colossus sebagai pembanding dari dunia pusat data. Dengan 200'000 GPU Hopper dan sekitar 3'958 INT8-TOPS per kelas H100, kita mendapat kira-kira 792 exa-operasi per detik daya puncak AI teoretis. Itu adalah puncak dengan sparsity; kinerja padat dan terus-menerus yang benar-benar bisa dipakai lebih rendah.
Silikon teoretis dalam perbandingan

Perkiraan kasar exa-operasi per detik, dirata-ratakan selama 24 jam. Tesla dan iPhone dihitung dengan jendela malam 6,5 jam; untuk Tesla dan iPhone grafik menunjukkan tingkat partisipasi teoretis, bukan kapasitas yang tersedia hari ini.

Tesla 50 % teoretis
125
PC / Workstation
200
xAI Colossus
792
iPhone 25 % teoretis
1'437
iPhone 50 % teoretis
2'875

Penting: ini bukan benchmark. FP32-FLOPS, INT8-TOPS, dan Neural-Engine-TOPS tidak bisa dipertukarkan 1:1. Memori, interkoneksi, perangkat lunak, verifikasi, efisiensi energi, hak platform, dan utilisasi nyata menentukan apakah daya puncak menjadi kerja yang berguna.

Ini bukan kapasitas global yang persis. Ini model berpikir. Dan tepat di sini kita harus mengerem: TOPS tidak bisa dituangkan begitu saja seperti liter air ke satu kolam bersama. Neural-Engine-TOPS dari iPhone, INT8-TOPS dari GPU, dan kinerja FP32 dari workstation adalah hal yang berbeda. Banyak pekerjaan yang masuk akal tidak hanya membutuhkan operasi komputasi, tetapi juga RAM, VRAM, bandwidth memori, durasi berjalan yang stabil, akses perangkat lunak, dan sistem operasi yang mengizinkan pekerjaan semacam itu.

Meski begitu, perhitungan ini menunjukkan mengapa idenya tidak konyol. Kombinasi konservatif dari PC, kendaraan, dan smartphone saja, sebagai silikon teoretis, masuk ke skala yang tidak lagi terlihat absurd kecil di samping salah satu pusat komputasi AI paling terlihat di dunia.

Angka iPhone sangat menarik karena hanya melihat lima tahun pengiriman, bukan seluruh basis terpasang yang aktif. Pada saat yang sama, angka ini adalah contoh terbaik mengapa kinerja puncak tidak cukup: iPhone bukan server. Ia punya batas panas, logika baterai, aturan sistem operasi, model privasi, dan pemilik yang berharap perangkatnya berfungsi pada pagi hari. Namun tetap ada daya komputasi di sana yang beberapa tahun lalu terdengar seperti fiksi ilmiah.

Dan bahkan nilai puncak ini tetap hanya nilai puncak. Smartphone, notebook tanpa kipas, atau unit kendali mobil tidak bisa begitu saja memberikan kinerja itu selama enam jam seperti GPU pusat data. Panas, throttling, dan logika perlindungan menekan kinerja berkelanjutan secara besar-besaran. Siapa pun yang ingin membangun jaringan nyata dari ini harus menghitung kinerja berkelanjutan, bukan angka tercantik di lembar spesifikasi.

Kita juga bisa memikirkannya lewat listrik. Jika 50 juta perangkat rata-rata menyumbang 150 watt selama empat jam per hari, itu sekitar 11 TWh per tahun. Itu hanya sebagian kecil dari konsumsi pusat data global saat ini. Tetapi cukup untuk menopang banyak pekerjaan latar belakang, embeddings, beban kerja ilmiah, rendering, tugas verifikasi, atau proses storage terdesentralisasi.

Keberatan yang tidak nyaman adalah: ini tidak otomatis lebih efisien. Pusat data punya pendinginan yang lebih baik, utilisasi lebih baik, listrik lebih murah, perangkat keras lebih baru, dan batching profesional. Perangkat rumah bisa lebih buruk per unit kerja komputasi yang berguna, terutama jika overhead besar atau jika baterai smartphone menua lebih cepat hanya demi beberapa sen credit. Grid komputasi terdesentralisasi tidak bagus hanya karena ia tersebar. Ia harus masuk akal untuk workload yang tepat: secara teknis, energi, dan ekonomi.

Hal ini makin menarik dengan AI PC baru. Canalys memperkirakan sekitar 100 juta AI PC dikirim pada 2025. Banyak perangkat ini membawa NPU dengan 40 TOPS atau lebih. TOPS tidak sama dengan GPU-FLOPS, dan NPU tidak menggantikan pusat data. Namun bahkan jika kita melihat daya ini dengan sangat hati-hati, muncul kelas baru perangkat keras AI lokal yang tidak hanya ada di atas kertas, tetapi tiba di kantor dan rumah.

Jadi poinnya bukan: “besok kita mengganti semua pusat data dengan PC gaming, Tesla, dan iPhone.” Poinnya adalah: kita membangun kapasitas sentral raksasa, sementara pada saat yang sama kapasitas terdistribusi yang sudah dibayar dalam jumlah besar dibiarkan hilang.

Daya komputasi cepat basi

Listrik bisa saya simpan. Tidak sempurna, tidak tanpa rugi, tetapi pada dasarnya bisa. Jika panel surya saya pada siang hari menghasilkan lebih banyak daripada yang saya butuhkan, energi masuk ke baterai atau jaringan. Pada malam hari saya bisa memakainya lagi, atau tetangga saya memakainya. Smart grid, penyimpanan baterai, dan model energi peer-to-peer membuat cara berpikir ini makin konkret: kadang saya memproduksi, kadang saya mengonsumsi, dan batas antara pelanggan dan penyedia menjadi lebih lunak.

Daya komputasi bekerja berbeda.

Satu jam GPU yang tidak terpakai kemarin tidak bisa saya ambil dari laci hari ini. Prosesor yang sepanjang malam tidak melakukan apa pun tidak menyimpan komputasi untuk nanti. Waktu itu hilang. Tidak bisa kembali. Compute adalah sumber daya yang cepat basi.

Itulah yang membuat perangkat menganggur menarik. Kita tidak hanya punya perangkat keras. Kita punya peluang yang terus-menerus kedaluwarsa. Pool yang realistis dalam jangka pendek terutama adalah GPU desktop, workstation, konsol game, server kecil, storage NAS, dan sumber daya kampus atau provider. Smartphone dan mobil lebih merupakan kasus tepi jangka panjang: menarik secara teknis, tetapi jauh lebih sulit karena baterai, panas, aturan platform, keamanan, dan kontrol produsen.

Jadi hambatannya bukan hanya matematika, tetapi juga insentif. Perangkat dengan silikon menganggur paling menarik justru berada di platform tertutup: Apple membangun infrastruktur Private Cloud Compute untuk permintaan Apple Intelligence yang besar, Tesla membangun kapasitas training sendiri lewat Cortex untuk FSD dan Optimus. Mengapa perusahaan seperti itu membuka armada perangkat mereka untuk pasar compute independen, jika kontrol atas hardware, software, dan cloud adalah benteng bisnis mereka?

Meski begitu, pertanyaan dasarnya tetap: mengapa kita memperlakukan daya komputasi terdistribusi seolah tidak relevan, sementara pada saat yang sama kita membangun fasilitas sentral yang makin besar?

Bisakah AI berjalan secara terdesentralisasi?

Di sini kita harus jujur: untuk banyak hal yang hari ini tampak sebagai AI, desentralisasi sulit.

Model bahasa besar bukan sekadar daftar tugas kecil yang bisa dilempar semaunya ke perangkat asing. Model membutuhkan RAM atau VRAM. Model membutuhkan bandwidth memori. Sebagian membutuhkan interkoneksi cepat. Dalam pembuatan token, model dijalankan berulang-ulang, dan setiap lompatan jaringan tambahan membuat respons lebih lambat. Membelah model frontier ke smartphone asing, laptop lama, dan mobil untuk jawaban chat interaktif biasanya tidak masuk akal.

Namun itu tidak berarti AI terdesentralisasi mustahil. Artinya hanya kita harus memilih tugas yang tepat.

Yang sangat cocok adalah pekerjaan yang tidak harus selesai dalam dua detik: embeddings untuk arsip besar, rangkuman batch, rendering, simulasi ilmiah, data sintetis, pengujian, crawling, tugas verifikasi, perbaikan storage terdesentralisasi, model lokal kecil, prapemrosesan, dan tugas yang hasilnya bisa diperiksa atau dihitung ulang beberapa kali.

Secara praktis, tugasnya harus dipisahkan jauh lebih rapi:

Kelas pekerjaanMasuk akal secara terdesentralisasi?Mengapa
Inferensi lokal privatYa, tetapi lokalData tetap di perangkat sendiri atau ruang kepercayaan sendiri.
Inferensi batch dan embeddingsSering yaThroughput lebih penting daripada latensi detik.
Subtugas yang bisa diverifikasiYa, jika bisa diperiksaHasil bisa dihitung ulang, diverifikasi lewat attestation, atau dikontrol dengan tes.
Storage dan replikasiYa, dengan aturanEnkripsi, erasure coding, audit, dan mekanisme perbaikan adalah komponen yang dikenal.
Training frontier dan SLA kerasCenderung tidakTerlalu banyak coupling, terlalu banyak VRAM, tuntutan interkoneksi, operasi, dan ketersediaan terlalu tinggi.

Model besar juga tidak sepenuhnya tertutup, tetapi butuh arsitektur lain. Petals menunjukkan bahwa inferensi kolaboratif dan fine-tuning model besar melalui sumber daya terdistribusi pada dasarnya mungkin. Prime Intellect melangkah lebih jauh dengan INTELLECT-2 dan menunjukkan bagaimana reinforcement learning terdistribusi dengan worker yang tidak dipercaya bisa bekerja jika hasilnya diverifikasi. Ini belum dunia tempat iPhone kamu diam-diam melatih GPT-7 pada malam hari. Tetapi ini petunjuk bahwa masalahnya tidak mustahil secara prinsip.

Awal yang realistis karena itu bukan: “kita sebarkan satu model raksasa ke semua perangkat.” Awal yang realistis adalah: model lokal lebih dulu, pool regional untuk batch job yang cocok, tugas yang dapat diverifikasi, zona data yang jelas, dan pusat data sentral hanya di tempat yang benar-benar perlu.

Mimpi lama sistem terdistribusi

Ada narasi internet yang lain. Narasi yang lebih sedikit terdengar seperti katedral dan lebih mirip kawanan.

Komputasi sukarela

SETI@home bagi saya selalu menjadi salah satu contoh paling indah. Jutaan orang membiarkan komputer mereka menghitung data radioastronomi di latar belakang. Bukan karena mereka mendapat dashboard SaaS, tetapi karena idenya cukup besar: kita bersama-sama mencari sinyal di derau alam semesta. Sejak Maret 2020 SETI@home tidak lagi membagikan Work Units baru dan berada dalam semacam hibernasi. Tetapi sebagai bukti bahwa komputasi sukarela bisa berjalan global, ia tetap penting.

BOINC, platform di balik dan di sekitarnya, menjelaskan dengan tenang mengapa ini bekerja: banyak pekerjaan independen dan intensif komputasi, ketika throughput lebih penting daripada latensi rendah. Itulah perbedaan yang menentukan. Sistem terdistribusi tidak harus mengirim setiap jawaban chat interaktif dalam dua detik. Ia bisa kuat di tempat pekerjaan dapat dipecah, diperiksa, dan tidak harus selesai seketika.

Penyimpanan tanpa tempat tetap

IPFS membawa gagasan yang sama ke wilayah penyimpanan. File tidak terutama dialamatkan lewat lokasi, melainkan lewat isinya. Isi itu punya sidik jari. Siapa pun yang memilikinya bisa mengirimkannya. Itu cara berpikir yang berbeda dari “file ini ada di server ini pada URL ini”.

Uang tanpa pembukuan pusat

Bitcoin, terlepas dari bagaimana kita menilai spekulasi dan konsumsi energinya, memopulerkan gagasan dasar yang mirip: sistem tanpa pembukuan pusat, tempat konsensus tidak bergantung pada satu lembaga. Tidak setiap gagasan terdesentralisasi otomatis baik. Tetapi Bitcoin menunjukkan bahwa protokol bisa kuat secara politik jika ia menghapus titik kontrol pusat.

Penyimpanan sebagai jaringan

Dalam penyimpanan juga ada percobaan menarik. Symform adalah penyedia cloud storage terdesentralisasi, tempat kapasitas storage berlebih bisa dimasukkan ke jaringan. Pada 2014 platform ini diakuisisi Quantum; saat itu disebut ada 45'000 pengguna dan usaha kecil di 170 negara. Storj, Sia, Filecoin, dan varian lain juga menunjukkan: idenya tidak baru. Hanya saja ia belum benar-benar tiba dalam keseharian.

Hari ini gagasan itu hidup dalam bentuk baru. Storj memecah file di sisi klien dalam keadaan terenkripsi dan mendistribusikan potongannya ke banyak Storage Nodes. Ini lebih dekat ke infrastruktur daripada romantisme: idealnya pengguna tidak melihat kawanan, melainkan layanan storage yang bekerja.

Compute sebagai marketplace

Golem dan Akash ingin membuat daya komputasi menganggur bisa diakses sebagai marketplace. Bagi saya, ini jembatan langsung ke artikel ini: bukan hanya ruang penyimpanan yang tersebar, tetapi juga prosesor, GPU, dan server kecil yang hari ini sering diam.

AI dalam kawanan terdistribusi

Andrej Karpathy juga muncul lagi di lingkungan ini: di Prime Intellect ia disebut sebagai pendukung terkenal, dan Prime Intellect dengan INTELLECT-2 memulai ronde training RL terdistribusi untuk model 32B parameter, tempat sumber daya komputasi heterogen dan permissionless bisa ikut berkontribusi.

Itu belum jawaban sempurna. Tetapi ia menunjukkan: mimpi itu belum hilang. Ia hanya terus mencari bentuk yang bisa bertahan dalam operasi nyata.

Belajar dari pembangkit listrik virtual

Yang menarik, cara berpikir ini di bidang listrik sudah lama tidak terdengar terlalu eksotis.

Tesla menjelaskan Virtual Power Plant-nya sebagai jaringan sumber energi terdistribusi: rumah dengan panel surya dan Powerwall diperlakukan bersama-sama seperti pembangkit listrik. Ketika jaringan membutuhkan dukungan, baterai bisa mengirim listrik. Pemilik menyediakan sumber daya dan mendapat uang atau manfaat lain. Satu Powerwall kecil. Tetapi bersama-sama mereka bisa relevan bagi jaringan.

Inilah analogi yang membuat compute menarik bagi saya. Satu GPU di home office, satu NAS, satu iPhone, atau satu mobil bukan pusat data. Tetapi banyak perangkat bersama-sama bisa membentuk lapisan baru: bukan untuk semuanya, bukan setiap saat, bukan tanpa aturan, tetapi untuk tugas tertentu.

Analoginya punya batas. Listrik jauh lebih mudah dipertukarkan daripada pekerjaan komputasi. Satu kilowatt jam tidak bergantung pada apakah ia sedang menjalankan model dengan VRAM 80 GB, pipeline embedding, atau perbaikan storage terenkripsi. Compute bergantung pada workload. Karena itu perlu kelas pekerjaan, scheduling, dan pengecualian keras.

Pada Tesla, kita bahkan melihat gagasan yang sama di dua tempat. Powerwall bisa menjadi bagian dari pembangkit listrik virtual. Mobil ke depannya diharapkan menjadi bagian dari armada robotaxi otonom, sehingga menghasilkan uang ketika pemiliknya sedang tidak memakainya. Apakah dan seberapa cepat itu benar-benar dapat berkembang dalam skala besar adalah pertanyaan lain. Tetapi gagasan dasarnya penting: perangkat privat tidak lagi hanya dikonsumsi, tetapi dapat bekerja sebagai infrastruktur pada jendela waktu kosong.

Compute bisa dipikirkan dengan cara serupa. Bukan sebagai penjualan listrik ke tetangga, melainkan sebagai penjualan waktu komputasi yang bisa diverifikasi, ruang storage, atau pekerjaan model ke sebuah sel regional. Pengguna pada akhirnya membayar listrik, panas, aus perangkat keras, dan risiko. Jadi ia juga harus dibayar. Tanpa poin ini, gagasan itu hanya menjadi eksperimen teknis yang cantik.

Mengapa kawanan begitu jarang menang

Jika desentralisasi terdengar begitu indah, mengapa ia tidak otomatis menang?

Karena sentralisasi sering menjadi paket produk yang lebih baik.

Pusat data bisa dikendalikan. Kawanan terdiri dari perangkat asing, sistem operasi berbeda, ketersediaan berubah-ubah, prediktabilitas buruk, dan pemilik yang mematikan, menjual, memperbarui, atau mencabut perangkat dari jaringan. Bagi product manager, ini bukan romantisme, melainkan sakit kepala.

Selain itu ada ekonomi. Banyak proyek terdesentralisasi mencoba menyelesaikan insentif lewat token. Itu bisa dimengerti, karena jaringan tanpa perusahaan pusat tetap membutuhkan kompensasi. Tetapi begitu biaya storage atau waktu komputasi dikaitkan dengan mata uang yang volatil, hal itu menjadi tidak menarik bagi perusahaan biasa. Saya tidak mau terabyte backup saya tiba-tiba lebih mahal karena sebuah coin dipompa di Twitter. Saya juga tidak mau anggaran jam GPU saya bergantung pada pasar yang terasa lebih seperti kasino daripada infrastruktur.

Lawan harganya juga bukan GPU on-demand termahal di cloud. Pembanding sebenarnya adalah tawaran spot dan preemptible, yaitu kapasitas pusat data berlebih yang dijual penyedia dengan diskon besar. Jaringan compute terdesentralisasi jadi tidak cukup hanya lebih indah secara filosofis. Ia harus bisa bersaing dengan kapasitas cloud yang sangat murah, terintegrasi baik, meskipun bisa dihentikan.

Rem kedua adalah kenyamanan. S3 tidak menang karena indah secara filosofis. Ia menang karena cukup mudah, cukup terdokumentasi, dan terintegrasi di mana-mana. Jika jaringan storage atau compute terdesentralisasi ingin relevan, bagi developer dan admin ia harus terasa hampir membosankan: masukkan API key, buat bucket, monitoring, invoice, SLA, restore test, selesai.

Lalu datang keamanan. Dalam jaringan perusahaan, tidak boleh tiba-tiba ada compute job asing masuk ke workstation. Firewall yang waras akan memblokirnya dan sistem threat intelligence akan menganggapnya mencurigakan. Secara praktis, sistem semacam itu harus bekerja dari dalam ke luar: node mendaftar ke sel, mengambil job yang sudah diperiksa, berjalan di sandbox, dan hanya melihat data yang boleh ia lihat. Kalau tidak, jaringan compute yang sah di level jaringan cepat terlihat seperti botnet yang sangat sopan.

Kepercayaan adalah titik keras berikutnya. Sistem terdesentralisasi harus bisa membuktikan bahwa pekerjaan dilakukan dengan benar tanpa setiap node boleh melihat semuanya. Untuk storage ada komponen yang dikenal: enkripsi, erasure coding, audit, mekanisme perbaikan. Untuk AI dan compute, ini lebih sulit. Bagaimana saya memeriksa apakah perangkat asing menjalankan model dengan benar? Bagaimana mencegah kebocoran data? Bagaimana melindungi perangkat peserta dari kode asing?

Aus perangkat keras juga lebih dari sekadar listrik. SSD dan NVMe memiliki batas tulis. Siapa pun yang terus-menerus menulis bobot model, data sementara, batch embedding, atau file swap ke perangkat konsumen mengonsumsi umur pakai nyata. Ditambah lagi masalah bandwidth: jika unduhan model atau dataset besar memakan waktu lebih lama dan menciptakan overhead jaringan lebih besar daripada komputasinya sendiri, perhitungannya runtuh. Data lebih berat daripada yang disiratkan metafora smart grid yang sederhana.

Di sinilah INTELLECT-2 menjadi menarik. Dalam papernya, Prime Intellect menggambarkan TOPLOC sebagai komponen yang memverifikasi rollout dari Inference Worker yang tidak dipercaya. Itu tidak tiba-tiba menyelesaikan semua masalah compute. Itu bukan perlindungan data ajaib untuk data perusahaan sembarang di perangkat keras asing. Tetapi ia menunjukkan mekanisme nyata untuk kelas kerja AI terdistribusi tertentu: job dirancang agar hasilnya dapat diperiksa, bukan agar kita harus mempercayai setiap worker secara buta.

Untuk data rahasia, itu saja tidak cukup. Di sana diperlukan komponen lain: Confidential Computing, Trusted Execution Environments, Remote Attestation, sandbox yang bersih, klasifikasi data yang jelas, dan bila perlu keputusan keras bahwa job tertentu sama sekali tidak boleh berjalan di hardware asing. Selain itu ada pertanyaan membosankan tetapi menentukan: pajak, tanggung jawab hukum, perlindungan data, residensi data, dan syarat layanan penyedia internet. Infrastruktur jarang gagal hanya karena matematika. Sering kali ia gagal karena operasi.

Smart grid komputasi

Saya tidak membayangkan “semuanya P2P dan semuanya otomatis baik” yang naif. Infrastruktur tidak bekerja seperti itu. Yang mungkin bekerja adalah smart grid komputasi dengan lapisan yang jelas.

Lapisan pertama bernama: lokal dulu. Segala sesuatu yang personal, rahasia, atau kritis terhadap latensi sebaiknya berjalan di perangkat sendiri atau ruang kepercayaan sendiri jika mungkin. Model kecil, pencarian lokal, rangkuman privat, klasifikasi sederhana, prapemrosesan, enkripsi, embeddings untuk data pribadi. Tidak setiap email, setiap catatan, dan setiap pencarian harus pergi ke hyperscaler.

Lapisan kedua bersifat regional dan federatif. Sebuah kota, lingkungan, kampus, perusahaan, koperasi, atau provider bisa mengoperasikan sebuah sel. Di sel ini perangkat menyediakan sumber daya secara sukarela, tetapi hanya dengan kondisi jelas: hanya saat tersambung listrik, hanya saat idle, hanya dalam batas termal, hanya dengan daya maksimum yang ditentukan, hanya untuk kelas job tertentu.

Titik awalnya bukan smartphone dan mobil, melainkan perangkat yang lebih membosankan: GPU desktop, workstation, konsol game, server kecil, sistem NAS, dan kapasitas bebas di provider lokal. Smartphone kemudian bisa mengambil job verifikasi kecil. Mobil baru mungkin terpikir lebih belakangan, dalam batas yang sangat sempit dan dikendalikan produsen. Sama seperti jaringan listrik, kita harus mulai dari sumber daya yang andal, terukur, dan dapat dikendalikan.

Lapisan ketiga tetap sentral. Training frontier, real-time keras, model yang sangat besar, kasus khusus yang sensitif secara regulasi, dan workload dengan coupling tinggi tetap berada di pusat data profesional. Desentralisasi tidak harus mengganti semuanya. Ia hanya harus mencegah setiap pekerjaan sehari-hari otomatis melewati lima pusat kekuasaan yang sama.

Jika ingin mengujinya, saya akan mulai kecil. Bukan dengan jutaan iPhone, tetapi dengan sel regional berisi mungkin 500 sampai 2'000 GPU desktop sukarela, workstation, sistem NAS, dan server kecil. Job yang diizinkan hanya sedikit: embeddings untuk data non-sensitif, batch job ilmiah, potongan storage terenkripsi, dan tugas verifikasi. Keberhasilan tidak diukur lewat angka exa yang cantik, melainkan tiga metrik membosankan: job selesai per $1 biaya listrik, tingkat kesalahan dan pengulangan, pembayaran setelah aus perangkat keras.

Bagian tersulit adalah kompensasi. Pengguna membayar listrik, panas, dan aus perangkat keras. Jadi ia perlu mendapatkan sesuatu kembali. Mungkin memang perlu token atau credit. Tetapi bukan sebagai objek spekulasi, melainkan sebagai saldo infrastruktur.

Compute credit semacam itu harus mewakili sesuatu yang nyata: satu menit GPU kelas tertentu, satu GB-bulan storage, satu inferensi terverifikasi, satu unit batch embedding, atau satu unit komputasi setara kWh. Siapa memberi sumber daya mendapat credit. Siapa kemudian membutuhkan daya AI menghabiskannya. Siapa tidak mau memakai credit bisa menariknya ke fiat, seperti pada pembangkit listrik virtual orang tidak ingin dibayar dengan “Powerwall coin”, tetapi dengan uang sungguhan atau kredit yang jelas.

Namun itu tidak secara ajaib menyelesaikan soal harga. Stabilitas perlu jangkar: penagihan fiat, koridor harga energi, clearing regional, tarif koperasi, atau operator teregulasi. Tanpa governance, “credit stabil” cepat menjadi token yang mengambang bebas. Dan kita kembali ke masalah lama: infrastruktur terasa seperti kasino.

Yang lebih penting lagi adalah pertanyaan hak operasi. Kita tidak harus melatih setiap foundation model besar sendiri. Mungkin kita membeli atau melisensikan model, open weights, atau keluarga model, lalu mengoperasikannya secara terdesentralisasi, federatif, dan terkendali secara regional. Kedaulatan sebenarnya tidak hanya berada di training, tetapi juga di operasi: Di mana model berjalan? Di mana data berada? Siapa boleh mengaudit? Apakah ada kanal balik ke penyedia? Bisakah saya tetap menjalankan model secara lokal jika politik, harga, atau terms berubah?

Agar ini lebih dari kontrak pembelian yang terdengar bagus, lisensi semacam itu harus berisi hak operasi nyata: deployment lokal, janji update dan keamanan jangka panjang, model card yang dapat ditelusuri, auditabilitas, hak keluar yang jelas, dan tidak ada kewajiban mendorong data sensitif kembali ke cloud sentral produsen. Itu bukan utopia terdesentralisasi murni. Tetapi itu jalur realistis antara swasembada naif dan platform lock-in total.

Malam ketika perangkat ikut menghitung

Bayangkan pukul 22:43. Desktop kamu dengan GPU sedang idle, NAS online, ponsel mengisi daya. Di pengaturan kamu menetapkan: maksimal 80 watt, hanya saat idle, hanya untuk workload terverifikasi dari wilayahmu, dan hanya jika kompensasi menutup biaya listrik plus kompensasi aus perangkat keras.

Agen lokal melaporkan kapasitas bebas. Bukan dengan nama kamu dan bukan dengan data pribadi kamu, tetapi sebagai node yang sudah diattestasi dengan kemampuan tertentu. Sel membagikan job kecil: simulasi, embeddings, potongan storage terenkripsi, tugas verifikasi.

Pada pagi hari tidak ada roket, tidak ada cerita Wall Street, tidak ada hype token. Hanya satu baris tenang:

Malam ini: 2,4 GPU-credit diperoleh, 18 GB-bulan storage dikonfirmasi, $0.31 biaya listrik diperkirakan.

Kemudian kamu memakai credit itu untuk model lokal yang bekerja di atas dokumenmu sendiri. Data sensitif tetap bersamamu. Kamu bukan hanya pelanggan. Kamu peserta.

Itu terdengar romantis. Ya. Tetapi kadang justru itulah alasan untuk menanggapi masalah rekayasa yang sulit dengan serius.

Kawanan dan gunung

Saya tidak percaya pusat data sentral akan hilang. Mereka terlalu efisien, terlalu penting, dan untuk beberapa tugas memang diperlukan. Gunung itu tetap ada. Pertanyaannya hanya apakah kita membangun fondasi lain di sampingnya.

Fondasi dari perangkat lokal, sel regional, protokol terbuka, credit stabil, dan model keamanan yang jelas. Fondasi tempat daya komputasi tidak hanya dijual dari atas ke bawah, tetapi mengalir di antara peserta. Fondasi tempat pekerjaan AI tertentu berjalan di tempat yang semestinya: pekerjaan privat secara lokal, pekerjaan regional secara regional, kasus batas global di pusat data.

Mungkin itu naif. Mungkin juga tidak. Pembangkit listrik virtual dulu juga pernah terdengar aneh: ribuan baterai kecil sebagai satu jaringan besar. Uang terdesentralisasi lama terdengar absurd. Mobil yang berjalan sendiri sebagai taksi terdengar seperti fiksi ilmiah. Tidak semuanya akan datang seperti yang dijanjikan. Tetapi arahnya jelas: sumber daya yang dulu berdiri pasif makin dipikirkan sebagai bagian dari sistem yang lebih besar.

Saat ini mesin yang tidak terpakai ada di mana-mana. Di rumah, kantor, garasi, ruang server, dan saku. Tidak semuanya cocok sama baiknya. Tidak semuanya seharusnya pernah menjalankan pekerjaan asing. Tetapi banyak yang sudah ada, sudah dibayar, dan sudah terhubung. Dan setiap detik yang tidak terpakai menghilang.

Mungkin kita harus mulai mendengarkan mereka.

Sampai jumpa lagi,
Joe

Sumber