আমাদের চারপাশে পড়ে থাকা অব্যবহৃত কম্পিউট ক্ষমতা

3 জুন, 2026 • 22 min read

সূচিপত্র

কখনও কখনও একটি বড় অবকাঠামোগত প্রশ্ন শুরু হয় খুব ছোট একটি ছবি দিয়ে: রাতে একটি স্মার্টফোন চার্জারে পড়ে আছে। ল্যাপটপ বন্ধ। গেম কনসোল বসার ঘরে অপেক্ষা করছে। গাড়ি গ্যারেজে দাঁড়িয়ে। চারদিকে কম্পিউট ক্ষমতা আছে, যা ইতিমধ্যে কেনা হয়েছে, বিদ্যুৎ পাচ্ছে এবং বেশির ভাগ সময় কিছুই করছে না।

একই সময়ে নতুন ডেটা সেন্টার তৈরি হচ্ছে, শিল্প কারখানার মতো বড়। GPU, ফাইবার, ট্রান্সফরমার, কুলিং প্রযুক্তি এবং বিদ্যুৎ চুক্তিতে ভরা হল। আমরা ডিজিটাল অবকাঠামোর একটি নতুন স্তর তৈরি করছি, যা আমাদের লেখা, খোঁজা, প্রোগ্রাম করা, বিশ্লেষণ করা এবং হয়তো একদিন সিদ্ধান্ত নেওয়াকেও বহন করবে।

যদি এই ক্ষমতার ছোট একটি অংশ শুধু নষ্ট হয়ে না যায়, তাহলে? এমন কোনো বুনো কল্পনা নয় যেখানে প্রতিটি ফোন হঠাৎ ডেটা সেন্টারের জায়গা নেয়। বরং একটি সিরিয়াস ভাবনা: এমন একটি Compute Smart Grid কি হতে পারে, যেখানে ডিভাইসগুলো স্বেচ্ছায়, সীমিতভাবে এবং পারিশ্রমিকের বিনিময়ে কম্পিউট ক্ষমতা দেয়?

PRISM থেকে Prompts প্রবন্ধে এই বিকাশের অন্য দিকটি আছে: কয়েকটি AI platform-এর ওপর ক্রমবর্ধমান নির্ভরতা, বিশেষ করে যুক্তরাষ্ট্র ও চীনের platform-এর ওপর। এখানে আমার আগ্রহ উল্টো ধারণায়। সরল P2P রোমান্টিকতা হিসেবে নয়, বরং একটি প্রযুক্তিগত প্রশ্ন হিসেবে: আসলে কত কম্পিউট ক্ষমতা ইতিমধ্যে ছড়িয়ে আছে, কোন AI কাজগুলো আদৌ ভাগ করা যায়, এবং মানুষকে ন্যায্যভাবে পারিশ্রমিক দিতে হলে কী ঘটতে হবে?

কম্পিউট ক্ষমতা সংরক্ষণ করা যায় না। অব্যবহৃত একটি GPU-hour কোনো রিজার্ভ নয়। সেটি স্রেফ হারিয়ে যায়।

ভাবনাটি

AI শুধু সফটওয়্যার নয়। AI হলো বিদ্যুৎ, কুলিং, ফাইবার, GPU, জমি, পানি এবং মূলধন। International Energy Agency অনুমান করে, 2024 সালে ডেটা সেন্টারগুলো বিশ্বজুড়ে প্রায় 415 TWh বিদ্যুৎ ব্যবহার করেছে, বৈশ্বিক বিদ্যুৎ ব্যবহারের প্রায় 1.5 শতাংশ। 2030 সালের মধ্যে এটি প্রায় 945 TWh হতে পারে।

এটি শুধু sustainability report-এর জন্য একটি সংখ্যা নয়। এটি অবকাঠামো রাজনীতি। AI services 7x24 উপলভ্য। প্রতিটি summary, প্রতিটি code question, প্রতিটি image, প্রতিটি agent run একটি calculation। আর যখন কোটি কোটি মানুষ ও কোম্পানি কাজকে AI loops-এর মধ্যে রাখে, তখন তা base load হয়ে যায়।

তাই বড় কেন্দ্রীভূত সমাধানের আকর্ষণ আমি বুঝি। ডেটা সেন্টার নিয়ন্ত্রণযোগ্য: একই hardware, একই racks, একই networks, পরিষ্কার security zones, SLAs, monitoring, billing। operations দৃষ্টিকোণ থেকে এটি আকর্ষণীয়। কিন্তু রাজনৈতিক, অর্থনৈতিক ও architectural দিক থেকে এটি আবার ঠিক সেটাই তৈরি করে যা নেটকে সবসময় ভঙ্গুর করেছে: কয়েকটি ক্ষমতার কেন্দ্র।

তাই ভাবনাটি শুরু হয় একটি সহজ পাল্টা প্রশ্ন দিয়ে: পরের ডেটা সেন্টার বানানোর আগে কী ইতিমধ্যে পড়ে আছে?

অব্যবহৃত ক্ষমতা কত বড়?

ধারণাটি আসলে খুব দৈনন্দিন একটি মুহূর্ত থেকে আসে। স্মার্টফোনটি রাতে bedside table-এ পড়ে থাকে, বিদ্যুতে যুক্ত, প্রায় কিছুই করছে না। কিন্তু ভেতরে এমন একটি chip আছে যার AI-specific compute power দশ বছর আগের অনেক computer-এর মোট ক্ষমতার চেয়েও বেশি। A17 Pro-সহ iPhone 15 Pro প্রতি সেকেন্ডে প্রায় 35 trillion Neural Engine operations করতে পারে। খুব সতর্ক একটি average নিলেও, রাতের বেশির ভাগ সময় অপেক্ষা করা একটি device-এর জন্য এটি অবিশ্বাস্যভাবে বেশি।

ডেস্কেও একই ঘটনা ঘটে। নতুন notebooks-এ এখন শুধু CPU ও GPU নেই, NPU বা Neural Engine-ও আছে। Apple বহু বছর ধরে তার chips-এ Neural Engine বসাচ্ছে। Windows notebooks AI-PCs হিসেবে dedicated AI processors নিয়ে আসছে। বসার ঘরের game console-এ এমন GPU power আছে, যা আগে workstation-এর মতো শোনাত। তবু আমরা এই local compute power সাধারণত ছোট ছোট peaks-এ ব্যবহার করি: একটি game, একটি export, একটি videocall, একটি local effect, একটি search। তারপর device আবার idle-এ ফিরে যায়।

ঠিক এখানেই ভাবনাটি শুরু হয়। প্রশ্নটি নয়: “আমি কি কাল আমার iPhone ডেটা সেন্টার হিসেবে ভাড়া দিতে পারি?” সেটি বাজে কথা। বরং: এত silicon যদি ইতিমধ্যে কেনা, networked এবং প্রতি রাতে বিদ্যুতে যুক্ত থাকে, তাহলে theoretical capacity কত বড় হবে, যদি শুধু ছোট, নিরাপদ, উপযুক্ত time windows ব্যবহার করা যায়?

বিশ্বের এই অব্যবহৃত compute power নির্ভুলভাবে মাপা যায় না। ডিভাইসগুলো খুব ভিন্ন, অনেক offline, অনেক battery, heat, security বা platform কারণে অংশ নিতেই পারে না। তবু একটি মোটামুটি হিসাব scale বোঝাতে সাহায্য করে।

তার জন্য কয়েকটি ইচ্ছাকৃতভাবে সরল block ধরা যাক। গুরুত্বপূর্ণ হলো: আমি এমনভাবে হিসাব করছি না যেন প্রতিটি device সবসময় পুরোপুরি available। আমি time windows, participation rates এবং cautious discounts ধরে গুনছি। এটি ভাবনাই থাকে, কিন্তু পায়ের নিচে কিছু সংখ্যা নিয়ে।

Tesla: চাকার ওপর Silicon

Tesla 2025 সালের জুনে আট-মিলিয়নতম উৎপাদিত vehicle জানিয়েছিল। প্রতিটি এখনও active নয়, প্রতিটিতে একই Autopilot hardware নেই, এবং প্রতিটি owner নিজের car compute network-এ দিতে চাইবে না। তাই আমি conservative হিসাব করি:

8 million উৎপাদিত vehicles-এর মধ্যে হয়তো 80 percent এখনও বাস্তবসম্মতভাবে active এবং technically relevant। অর্থাৎ 6.4 million vehicles।
Hardware 3, অর্থাৎ 2019 থেকে FSD Computer, system-এর জন্য প্রায়ই 144 TOPS order of magnitude বলা হয়।
Hardware 4 নতুন vehicles-এ আছে এবং modern, কিন্তু Tesla পুরনো Autonomy Day সংখ্যার মতো পরিষ্কার, সহজ TOPS value প্রকাশ করে না। তাই এই calculation-এ আমি তবু 144 TOPS conservative base value হিসেবে ধরি।
একটি car প্রায়ই দিনে 23 ঘণ্টা দাঁড়িয়ে থাকে, কিন্তু আসল আকর্ষণীয় অংশ হলো charging window। রাতে যদি এটি 6.5 hours power-এ থাকে, তাহলে 24 hours average-এ তা প্রায় 27 percent availability।

যদি active Tesla owners-এর মাত্র 25 percent sign up করে, তবে তা হবে 1.6 million vehicles এবং day-equivalent হিসেবে প্রায় 62 Exa operations per second। 50 percent participation হলে প্রায় 125 Exa operations per second। theoreticalভাবে সব active vehicles অংশ নিলে সংখ্যাটি প্রায় 250 Exa operations per second। রাতের window-তে momentary performance বেশি হবে; day-equivalent number কেবল 24 ঘণ্টা চলা data center-এর সঙ্গে fair comparison।

iPhones: বড় বিস্ময়

iPhones-এর হিসাব একসঙ্গে সহজ এবং কঠিন। সহজ, কারণ Apple প্রতি বছর বিপুল পরিমাণ device ship করে। কঠিন, কারণ Apple পরিষ্কার public table দেয় না কোন iPhone generation বিশ্বজুড়ে এখনও active। তাই আমি সাম্প্রতিক বছরগুলোর published shipments নিয়ে তার ওপর plausible active remaining rate বসাই।

বছর	shipped iPhones	আনুমানিক chip mix	ধরা active rate	গড় Neural Engine performance
2021	235.7 million	A14/A15	55 %	12 TOPS
2022	226.4 million	A15/A16	65 %	16 TOPS
2023	234.6 million	A16/A17 Pro	75 %	22 TOPS
2024	233.1 million	A16/A17/A18	85 %	30 TOPS
2025	247.8 million	A18/A19	95 %	32 TOPS

এই mixed calculation শুধু পাঁচ shipment year থেকে প্রায় 885 million সম্ভবত এখনও active iPhones দেয়। এটি পুরো iPhone base নয়, ইচ্ছাকৃতভাবে সীমিত অংশ। পুরোনো A14/A15 generations low double-digit TOPS range-এ ছিল, A16 প্রায় 17 TOPS, A17 Pro প্রায় 35 TOPS। তাই প্রতি বছরের average নেওয়া সব devices-এর একই chip আছে বলে ধরে নেওয়ার চেয়ে যুক্তিসঙ্গত।

আবার একই খেলা: রাতে power-এ 6.5 hours, পুরো দিন নয়। এই devices-এর 25 percent অংশ নিলে day-equivalent হিসেবে প্রায় 1'437 Exa operations per second পাওয়া যায়। 50 percent participation হলে প্রায় 2'875 Exa operations per second। theoreticalভাবে সব devices অংশ নিলে সংখ্যাটি প্রায় 5'750 Exa operations per second।

এটি পাগলামির মতো শোনায়। কিন্তু আসল কথাই সেটি। iPhone server বলে নয়। বরং device mass এত বড় যে cautious quotas-ও হঠাৎ এমন order of magnitude-এ পৌঁছে যায়, যা আমরা সাধারণত data centers-এর সঙ্গে যুক্ত করি।

তুলনা

আরও reference point হিসেবে নিচ্ছি:

50 million desktop GPUs, workstations বা small servers, যা average-এ 20 TFLOPS FP32 দিতে পারে। এর মধ্যে শুধু 20 percent practically usable হলেও suitable time windows-এ প্রায় 200 Exa operations per second থাকে।
xAI Colossus data center world থেকে comparison। 200'000 Hopper GPUs এবং H100 order of magnitude-এ প্রায় 3'958 INT8-TOPS ধরলে প্রায় 792 Exa operations per second theoretical AI peak performance পাওয়া যায়। এটি sparsity peak; dense এবং continuously usable performance কম।

তাত্ত্বিক Silicon-এর তুলনা

প্রতি সেকেন্ডে মোটামুটি Exa operations, 24 ঘণ্টায় average করা। Tesla ও iPhones 6.5 ঘণ্টার রাতের window ধরে হিসাব করা; Tesla ও iPhones-এর ক্ষেত্রে graphic theoretical participation rates দেখায়, আজ ব্যবহারযোগ্য capacity নয়।

Tesla 50 % theoretical

125

PCs / Workstations

200

xAI Colossus

792

iPhones 25 % theoretical

1'437

iPhones 50 % theoretical

2'875

গুরুত্বপূর্ণ: এটি benchmark নয়। FP32-FLOPS, INT8-TOPS এবং Neural Engine TOPS 1:1 interchangeable নয়। Memory, interconnect, software, verification, energy efficiency, platform rights এবং real utilization ঠিক করে peak performance থেকে usable work তৈরি হবে কি না।

এটি কোনো exact global capacity নয়। এটি একটি thought model। আর ঠিক এখানেই থামতে হয়: TOPS-কে litre পানি মতো একটি common pool-এ ঢালা যায় না। iPhone-এর Neural Engine TOPS, GPU-এর INT8 TOPS এবং workstation-এর FP32 performance আলাদা জিনিস। অনেক useful job-এর শুধু compute operations নয়, RAM, VRAM, memory bandwidth, stable runtime, software access এবং এমন operating system দরকার যা এমন job অনুমোদন করে।

তবু হিসাবটি দেখায়, idea হাস্যকর নয়। PCs, vehicles এবং smartphones-এর একটি conservative combination theoretical Silicon হিসেবে এমন order of magnitude-এ পৌঁছায়, যা বিশ্বের সবচেয়ে visible AI data centers-এর একটির পাশে আর absurdly small লাগে না।

iPhone number বিশেষভাবে interesting, কারণ এটি শুধু পাঁচ shipment year দেখে, পুরো active installed base নয়। একই সঙ্গে এটি দেখায় কেন peak performance যথেষ্ট নয়: iPhone server নয়। এর heat limits, battery logic, operating system rules, privacy models এবং একজন owner আছে, যে সকালে একটি functioning device আশা করে। তবু সেখানে এমন compute power পড়ে আছে, যা কয়েক বছর আগেও science fiction মনে হতো।

আর এই peak values-ও শুধু peak values। Smartphone, fanless notebook বা car control unit এমন performance ছয় ঘণ্টা ধরে data center GPU-এর মতো দিতে পারে না। Thermals, throttling এবং protection logic sustained performance অনেক কমিয়ে দেয়। তাই real network বানাতে হলে datasheet-এর সবচেয়ে সুন্দর number নয়, sustained performance ধরে হিসাব করতে হবে।

এটি electricity দিয়েও ভাবা যায়। যদি 50 million devices average-এ 150 watt করে দিনে চার ঘণ্টা contribute করে, তবে বছরে প্রায় 11 TWh হয়। আজকের global data center consumption-এর ছোট অংশ। কিন্তু অনেক background jobs, embeddings, scientific workloads, rendering, verification tasks বা decentralized storage processes বহন করার জন্য যথেষ্ট।

অস্বস্তিকর আপত্তি হলো: এটি স্বয়ংক্রিয়ভাবে efficient নাও হতে পারে। Data centers-এর cooling ভালো, utilization ভালো, electricity সস্তা, hardware নতুন, batching professional। একটি home device প্রতি useful computation-এ খারাপ হতে পারে, বিশেষ করে অনেক overhead হলে বা smartphone battery কয়েক cent credit-এর জন্য দ্রুত বুড়িয়ে গেলে। তাই decentralized compute grid distributed বলেই ভালো নয়। suitable workloads-এর জন্য সেটিকে net meaningful হতে হবে: technically, energetically এবং economically।

নতুন AI-PCs এলে বিষয়টি আরও আকর্ষণীয় হয়। Canalys 2025 সালের জন্য প্রায় 100 million shipped AI-PCs আশা করেছিল। এসব devices-এর অনেকগুলিতে 40 TOPS বা তার বেশি NPU থাকে। TOPS GPU-FLOPS-এর মতো নয়, এবং NPU data center replace করে না। কিন্তু খুব সতর্কভাবে দেখলেও local AI hardware-এর নতুন class তৈরি হচ্ছে, যা শুধু paper-এ নয়, offices ও homes-এ পৌঁছাচ্ছে।

সুতরাং মূল কথা এটি নয়: “আমরা কাল সব data center gaming PCs, Teslas এবং iPhones দিয়ে replace করব।” মূল কথা হলো: আমরা বিশাল নতুন central capacity তৈরি করছি, যখন একই সময়ে বিপুল distributed, already paid capacity unused হয়ে নষ্ট হচ্ছে।

কম্পিউট ক্ষমতা পচে যায়

বিদ্যুৎ আমি store করতে পারি। perfect নয়, lossless নয়, কিন্তু মূলত পারি। আমার solar system দুপুরে প্রয়োজনের চেয়ে বেশি produce করলে energy battery বা grid-এ যায়। সন্ধ্যায় আমি সেটি আবার ব্যবহার করতে পারি, অথবা আমার প্রতিবেশী ব্যবহার করতে পারে। Smart grids, battery storage এবং peer-to-peer energy models এই ভাবনাকে আরও concrete করছে: কখনও আমি produce করি, কখনও consume করি, এবং customer ও provider-এর সীমা নরম হয়।

কম্পিউট ক্ষমতা ভিন্নভাবে কাজ করে।

গতকালের অব্যবহৃত GPU-hour আজ drawer থেকে বের করা যায় না। যে processor পুরো রাত কিছু করেনি, সে ভবিষ্যতের জন্য compute জমিয়ে রাখেনি। সময়টি চলে গেছে। ফেরে না। Compute পচনশীল।

ঠিক এ কারণেই unused devices interesting। আমাদের শুধু hardware নেই। আমাদের ক্রমাগত নষ্ট হয়ে যাওয়া opportunities আছে। short-term realistic pool হলো বিশেষ করে desktop GPUs, workstations, game consoles, small servers, NAS storage এবং campus বা provider resources। Smartphones ও cars বেশি long-term edge cases: technically fascinating, কিন্তু battery, heat, platform rules, security এবং manufacturer control-এর কারণে অনেক বেশি difficult।

সমস্যা তাই শুধু mathematics-এ নয়, incentive-এও। সবচেয়ে interesting idle Silicon থাকা devices আসলে closed platforms-এর: Apple বড় Apple Intelligence requests-এর জন্য Private Cloud Compute দিয়ে নিজের infrastructure বানায়, Tesla FSD ও Optimus-এর জন্য Cortex দিয়ে নিজের training capacity। hardware, software এবং cloud-এর control যদি আসল moat হয়, তবে এই companies কেন তাদের device fleet manufacturer-independent compute market-এর জন্য খুলবে?

তবু মূল প্রশ্ন থাকে: আমরা distributed compute power-কে irrelevant হিসেবে কেন দেখি, যখন একই সঙ্গে ক্রমেই বড় central facilities বানাচ্ছি?

AI কি আদৌ decentralized ভাবে compute করতে পারে?

এখানে সৎ হতে হবে: আজ visible AI-এর অনেক কিছুর জন্য decentralization কঠিন।

একটি বড় language model ছোট tasks-এর simple list নয়, যা যেকোনো foreign devices-এ ছুড়ে দেওয়া যায়। Models-এর RAM বা VRAM দরকার। memory bandwidth দরকার। কখনও fast interconnects দরকার। Token generation-এ model বারবার run হয়, এবং প্রতিটি extra network hop response ধীর করে। interactive chat answer-এর জন্য একটি frontier model বিদেশি smartphones, পুরোনো laptops ও cars-এ ভাগ করা সাধারণত অর্থহীন।

কিন্তু এর মানে decentralized AI অসম্ভব নয়। মানে শুধু সঠিক tasks বেছে নিতে হবে।

যেসব কাজ দুই seconds-এ শেষ হতে হবে না, সেগুলো ভালো fit: বড় archives-এর embeddings, batch summaries, rendering, scientific simulations, synthetic data, tests, crawling, verification tasks, decentralized storage repair, small local models, preprocessing এবং এমন tasks যেখানে results check করা বা multiple times compute করানো যায়।

বাস্তবে tasks আরও পরিষ্কারভাবে আলাদা করতে হবে:

Job class	Decentralizedভাবে যুক্তিসঙ্গত?	কেন
Private local inference	হ্যাঁ, কিন্তু local	Data নিজের device বা নিজের trust space-এ থাকে।
Batch inference এবং embeddings	প্রায়ই হ্যাঁ	seconds latency-এর চেয়ে high throughput বেশি গুরুত্বপূর্ণ।
Verifiable subjobs	হ্যাঁ, যদি checkable হয়	Results multiple times compute, attest বা tests দিয়ে verify করা যায়।
Storage এবং replication	হ্যাঁ, rules সহ	Encryption, erasure coding, audits এবং repair mechanisms এখানে known building blocks।
Frontier training এবং hard SLAs	বরং না	খুব বেশি coupling, খুব বেশি VRAM, interconnect, operation ও availability requirements অনেক বেশি।

Large models পুরোপুরি excluded নয়, কিন্তু অন্য architecture দরকার। Petals দেখিয়েছে distributed resources দিয়ে বড় models-এর collaborative inference এবং fine-tuning মূলত সম্ভব। Prime Intellect INTELLECT-2 দিয়ে আরও এক ধাপ এগিয়ে দেখিয়েছে, untrusted workers দিয়ে distributed Reinforcement Learning কীভাবে কাজ করতে পারে, যদি results verify করা হয়। এটি এখনও সেই পৃথিবী নয় যেখানে তোমার iPhone রাতে গোপনে GPT-7 train করে। কিন্তু এটি ইঙ্গিত দেয় যে problem fundamentally impossible নয়।

তাই realistic start হবে না: “আমরা একটি huge model সবকিছুর ওপর distribute করি।” realistic start হবে: local models first, suitable batch jobs-এর জন্য regional pools, verifiable tasks, clear data zones এবং central data centers শুধু যেখানে সত্যিই দরকার।

Distributed systems-এর পুরোনো স্বপ্ন

Internet-এর আরেকটি গল্প আছে। যেটি cathedral-এর চেয়ে distributed swarm-এর মতো বেশি শোনায়।

স্বেচ্ছাসেবী compute

SETI@home আমার কাছে সবসময় সবচেয়ে সুন্দর উদাহরণগুলোর একটি। Millions of people তাদের computers-কে background-এ radio astronomy data calculate করতে দিয়েছিল। এজন্য নয় যে তারা SaaS dashboard পেয়েছিল, বরং idea যথেষ্ট বড় ছিল: আমরা সবাই মিলে universe-এর noise-এ signals খুঁজি। March 2020 থেকে SETI@home নতুন Work Units distribute করছে না এবং এক ধরনের hibernation-এ আছে। কিন্তু voluntary computing global scale-এ কাজ করতে পারে তার proof হিসেবে এটি গুরুত্বপূর্ণ।

BOINC, এর পেছনের ও পাশের platform, soberভাবে বলে কেন এটি কাজ করে: অনেক independent, compute-intensive jobs, যেখানে throughput low latency-এর চেয়ে বেশি গুরুত্বপূর্ণ। এটিই decisive difference। distributed system-কে প্রতিটি interactive chat answer দুই seconds-এ deliver করতে হবে না। এটি শক্তিশালী হতে পারে যেখানে work divisible, verifiable এবং immediately due নয়।

নির্দিষ্ট জায়গা ছাড়া storage

IPFS একই ভাবনাকে storage field-এ নিয়ে যায়। Files primarily কোনো place দিয়ে নয়, content দিয়ে addressed হয়। Content-এর fingerprint থাকে। যার কাছে content আছে, সে deliver করতে পারে। এটি “এই file এই server-এ এই URL-এর নিচে আছে” ভাবনা থেকে আলাদা।

Central bookkeeping ছাড়া money

Bitcoin, speculation এবং energy consumption-কে যেভাবেই বিচার করা হোক, একটি similar original idea popular করেছে: central bookkeeping ছাড়া system, যেখানে consensus কোনো single institution-এর ওপর নির্ভর করে না। প্রতিটি decentralized idea automatically ভালো নয়। কিন্তু Bitcoin দেখিয়েছে, central control point সরালে protocol politically powerful হতে পারে।

Network হিসেবে storage

Storage-এও interesting attempts ছিল। Symform ছিল decentralized cloud storage provider, যেখানে excess storage network-এ যোগ করা যেত। 2014 সালে platform Quantum acquired করে; তখন 170 countries-এ 45'000 users এবং small businesses-এর কথা বলা হয়েছিল। Storj, Sia, Filecoin এবং অন্যান্য variants-ও দেখায়: idea নতুন নয়। এটি শুধু everyday life-এ পুরোপুরি পৌঁছায় না।

আজ idea নতুন forms-এ বেঁচে আছে। Storj files client-side encrypted করে টুকরো করে অনেক Storage Nodes-এ distribute করে। এটি romance-এর চেয়ে infrastructure-এর কাছাকাছি: user ideally swarm দেখে না, বরং কাজ করা একটি storage service দেখে।

Marketplace হিসেবে compute

Golem এবং Akash unused compute power marketplace হিসেবে accessible করতে চায়। আমার কাছে এটি এই article-এর direct bridge: শুধু storage space নয়, processors, GPUs এবং small servers-ও distributed পড়ে আছে, যা আজ অনেক সময় idle থাকে।

Distributed swarm-এ AI

Andrej Karpathy-ও এই environment-এ আবার দেখা যায়: Prime Intellect-এ তাঁকে prominent supporter বলা হয়, এবং Prime Intellect INTELLECT-2 দিয়ে 32B-parameter model-এর decentralized distributed RL training round শুরু করেছে, যেখানে heterogeneous, permissionless compute resources contribute করতে পারে।

এটি এখনও perfect answer নয়। কিন্তু দেখায়: স্বপ্ন হারিয়ে যায়নি। এটি শুধু বারবার এমন form খুঁজছে, যা real operation-এ survive করতে পারে।

Virtual power plant থেকে শেখা

Interesting হলো, electricity sector-এ এই ভাবনা এখন আর এত exotic শোনায় না।

Tesla তার Virtual Power Plant-কে distributed energy sources-এর network হিসেবে describe করে: solar systems এবং Powerwalls-সহ homes একসঙ্গে power plant-এর মতো বিবেচিত হয়। Grid-এর support দরকার হলে batteries electricity দিতে পারে। Owner resource provide করে এবং তার জন্য money বা other benefits পায়। individual Powerwalls ছোট। একসঙ্গে তারা grid-এর জন্য relevant হতে পারে।

Compute নিয়ে এই analogy-ই আমাকে fascinate করে। Home office-এর একটি GPU, একটি NAS, একটি iPhone বা একটি car data center নয়। কিন্তু many devices together নতুন layer তৈরি করতে পারে: সবকিছুর জন্য নয়, সবসময় নয়, rules ছাড়া নয়, কিন্তু নির্দিষ্ট tasks-এর জন্য।

Analogy-র limits আছে। Electricity compute work-এর চেয়ে অনেক বেশি fungible। একটি kilowatt-hour এই প্রশ্নে নির্ভর করে না যে সেটি এখন 80 GB VRAM model, embedding pipeline নাকি encrypted storage repair চালাবে। Compute workload-dependent। তাই job classes, scheduling এবং hard exclusions দরকার।

Tesla-তে একই thought দুটো জায়গায় দেখা যায়। Powerwalls virtual power plant-এর অংশ হতে পারে। Cars ভবিষ্যতে autonomous Robotaxi fleet-এর অংশ হওয়ার কথা, অর্থাৎ owner যখন নিজে ব্যবহার করছেন না তখন money earn করবে। এটি সত্যিই কত দ্রুত scale করবে, আলাদা প্রশ্ন। কিন্তু basic idea important: private device আর শুধু consumed নয়, free time windows-এ infrastructure হিসেবে কাজ করতে পারে।

Compute-ও similarly ভাবা যেতে পারে। প্রতিবেশীকে electricity বিক্রি হিসেবে নয়, বরং regional cell-কে verifiable compute time, storage space বা model work বিক্রি হিসেবে। User শেষ পর্যন্ত electricity, heat, hardware wear এবং risk দেয়। তাই তাকে compensated হতে হবে। এই point ছাড়া idea শুধু সুন্দর technical experiment হয়ে থাকে।

Distributed model এত কম কেন জেতে

Decentralization এত সুন্দর শোনালে, সেটি সহজেই জেতে না কেন?

কারণ centralization প্রায়ই ভালো product package দেয়।

Data center নিয়ন্ত্রণযোগ্য। Distributed pool তৈরি হয় foreign devices, different operating systems, changing availability, poor predictability এবং এমন owners দিয়ে, যারা device off করতে, sell করতে, update করতে বা network থেকে disconnect করতে পারেন। Product manager-এর কাছে এটি romance নয়, সরাসরি মাথাব্যথা।

তার সঙ্গে economics আসে। অনেক decentralized projects incentives token দিয়ে solve করার চেষ্টা করেছে। বিষয়টি বোঝা যায়, কারণ central company ছাড়া network-এ compensation দরকার। কিন্তু storage বা compute time-এর cost volatile currency-র সঙ্গে যুক্ত হলেই normal companies-এর জন্য তা unattractive হয়। আমি চাই না আমার terabyte backup হঠাৎ expensive হয়ে যাক কারণ Twitter-এ কোনো coin pump হচ্ছে। GPU-hours budget-ও এমন market-এর ওপর depend করুক চাই না, যা infrastructure-এর চেয়ে casino-এর মতো লাগে।

আর দামের আসল প্রতিপক্ষ cloud-এর সবচেয়ে expensive on-demand GPU নয়। সত্যিকারের comparison হলো Spot এবং Preemptible offers, অর্থাৎ data center providers-এর already excess capacity, যা তারা significant discount-এ বিক্রি করে। decentralized compute network-কে তাই শুধু philosophically prettier হলেই হবে না। তাকে very cheap, well-integrated, যদিও interruptible, cloud capacity-এর বিরুদ্ধে টিকতে হবে।

দ্বিতীয় brake হলো convenience। S3 philosophically beautiful বলে জেতেনি। এটি জিতেছে কারণ enough simple, enough documented এবং everywhere integrated ছিল। decentralized storage বা compute networks relevant হতে চাইলে developers ও admins-এর কাছে প্রায় boring লাগতে হবে: API key দাও, bucket বানাও, monitoring, invoice, SLA, restore test, done।

এরপর security। Enterprise network-এ হঠাৎ কোনো foreign compute job inbound হয়ে workstations-এ land করা উচিত নয়। যেকোনো sensible firewall এটি block করবে এবং Threat Intelligence systems suspicious ভাববে। বাস্তবে এমন system-কে ভিতর থেকে বাইরে কাজ করতে হবে: node কোনো cell-এ report করে, checked jobs নেয়, sandbox-এ run করে এবং শুধু সেই data দেখে যা দেখার অনুমতি আছে। নইলে legitimate compute network network layer-এ দ্রুত খুব politely formulated botnet-এর মতো দেখাবে।

Trust হলো পরের কঠিন point। Decentralized systems-কে prove করতে হবে যে work correctly done হয়েছে, কিন্তু প্রতিটি node-কে সবকিছু না দেখিয়ে। Storage-এ known building blocks আছে: encryption, erasure coding, audits, repair mechanisms। AI এবং compute-এ এটি কঠিন। কীভাবে check করব foreign device model correctly execute করেছে? data leakage কীভাবে আটকাব? participant-এর device foreign code থেকে কীভাবে protect করব?

Hardware wear শুধু electricity নয়। SSDs এবং NVMe storage-এর write limits আছে। কেউ যদি model weights, temporary data, embedding batches বা swap files consumer devices-এ ক্রমাগত লেখে, তবে real lifetime খরচ হয়। Bandwidth problem-ও আছে: যদি large model বা dataset download করতে actual calculation-এর চেয়ে বেশি সময় ও network overhead লাগে, হিসাব উল্টে যায়। Data simple Smart Grid metaphor যা বোঝায় তার চেয়ে heavy।

ঠিক এখানে INTELLECT-2 interesting। Prime Intellect তার paper-এ TOPLOC-কে এমন building block হিসেবে describe করে, যা untrusted inference workers-এর rollouts verify করে। এটি হঠাৎ সব compute problems solve করে না। foreign hardware-এ arbitrary company data-এর জন্য এটি magical privacy নয়। কিন্তু distributed AI work-এর একটি specific class-এর জন্য real mechanism দেখায়: jobs এমনভাবে built হয় যাতে results verifiable হয়, প্রতিটি worker-কে blind trust করার বদলে।

Confidential data-এর জন্য এটি alone enough নয়। সেখানে অন্য building blocks দরকার: Confidential Computing, Trusted Execution Environments, Remote Attestation, clean sandboxes, clear data classification এবং doubt হলে hard decision যে কিছু jobs foreign hardware-এ চলবেই না। এর সঙ্গে boring কিন্তু decisive প্রশ্ন আসে: tax, liability, privacy, data residency এবং internet providers-এর terms। Infrastructure rarely শুধু mathematics-এ fail করে। প্রায়ই operations-এ fail করে।

একটি Compute Smart Grid

আমি কোনো naive “সবকিছু P2P এবং তারপর সব ভালো” কল্পনা করছি না। Infrastructure এভাবে কাজ করে না। যা কাজ করতে পারে, তা হলো পরিষ্কার layers-সহ Compute Smart Grid।

প্রথম layer: local first। যা personal, confidential বা latency-critical, যতটা সম্ভব নিজের device বা নিজের trust space-এ চলা উচিত। Small models, local search, private summaries, simple classification, preprocessing, encryption, personal data-এর embeddings। প্রতিটি email, note এবং search hyperscaler-এ যেতে হবে না।

দ্বিতীয় layer regional এবং federated। একটি city, neighborhood, campus, company, cooperative বা provider একটি cell চালাতে পারে। এই cell-এ devices voluntarily resources provide করবে, কিন্তু clear conditions-সহ: শুধু power-এ, শুধু idle-এ, শুধু thermal limits-এর ভেতরে, শুধু defined maximum power-সহ, শুধু specific job classes-এর জন্য।

Starting point smartphones এবং cars নয়, বরং boring devices: desktop GPUs, workstations, game consoles, small servers, NAS systems এবং local providers-এর spare capacity। Smartphones পরে small verification jobs নিতে পারে। Cars আরও পরে conceivable, very narrow manufacturer-controlled limits-এ। electricity grid-এর মতোই প্রথমে reliable, measurable এবং controllable resources দিয়ে শুরু করতে হবে।

তৃতীয় layer central থাকে। Frontier training, hard real time, extremely large models, regulatory sensitive special cases এবং highly coupled workloads professional data centers-এ belong করে। Decentralization সব replace করতে হবে না। শুধু প্রতিটি everyday task যেন automatically একই পাঁচ power centers দিয়ে না যায়, সেটি আটকাতে হবে।

এটি test করতে হলে, আমি ছোট শুরু করতাম। millions of iPhones নয়, বরং 500 থেকে 2'000 voluntary desktop GPUs, workstations, NAS systems এবং small servers-এর regional cell। Allowed job types খুব কম: non-sensitive data-এর embeddings, scientific batch jobs, encrypted storage pieces এবং verification tasks। Success মাপা হবে কোনো pretty Exa number দিয়ে নয়, তিনটি boring metrics দিয়ে: completed jobs per $1 electricity cost, error and repeat rate, hardware wear-এর পর payout।

সবচেয়ে কঠিন অংশ compensation। User electricity, heat এবং hardware wear দেয়। তাই তার কিছু ফেরত দরকার। সম্ভবত সত্যিই token বা credit দরকার। কিন্তু speculation object হিসেবে নয়, infrastructure balance হিসেবে।

এমন Compute Credit কোনো real জিনিসের প্রতিনিধিত্ব করতে হবে: নির্দিষ্ট class-এর GPU minute, GB-month storage, verified inference, batch embedding unit বা kWh-equivalent compute unit। যে resources দেয়, credits earn করে। পরে যে নিজের AI power দরকার, সে তা spend করে। যে consume করতে চায় না, সে fiat-এ cash out করতে পারে, যেমন virtual power plant-এ কেউ “Powerwall Coins” নয়, real money বা clear credit পেতে চায়।

তাতে pricing question magically solved হয় না। Stability-র anchor দরকার: fiat billing, energy price corridors, regional clearing houses, cooperative tariffs বা regulated operators। Governance ছাড়া “stable credits” দ্রুত free-floating token হয়ে যায়। আর তখন পুরোনো problem ফিরে আসে: infrastructure casino-এর মতো লাগে।

আরও গুরুত্বপূর্ণ operating rights-এর প্রশ্ন। প্রতিটি বড় foundation model নিজে train করতে হবে না। হয়তো models, open weights বা model families কেনা বা license করা হবে এবং তারপর decentralized, federated ও regionally controlledভাবে operate করা হবে। আসল sovereignty তখন শুধু training-এ নয়, operation-এ: models কোথায় চলে? data কোথায় থাকে? কে audit করতে পারে? provider-এর back channel আছে? politics, prices বা terms বদলালে আমি কি model locally চালিয়ে যেতে পারি?

এটি যেন শুধু সুন্দর purchase contract না হয়, তাই এমন licenses-এ real operating rights থাকতে হবে: local deployments, long-term update and security commitments, traceable model cards, auditability, clear exit rights এবং sensitive data আবার central manufacturer cloud-এ ঠেলে দেওয়ার বাধ্যবাধকতা না থাকা। এটি pure decentralized utopia নয়। কিন্তু naive self-sufficiency এবং total platform lock-in-এর মাঝখানে realistic path।

যে রাতে devices compute করে

ভাবো, রাত 22:43। GPU-সহ তোমার desktop idle, NAS online, phone charging। Settings-এ তুমি ঠিক করেছ: maximum 80 watts, only idle, শুধু region-এর checked workloads-এর জন্য এবং শুধু compensation electricity costs plus hardware allowance cover করলে।

একটি local agent free capacity report করে। তোমার নাম দিয়ে নয়, private data দিয়ে নয়, বরং নির্দিষ্ট capabilities-সহ attested node হিসেবে। Cell ছোট jobs distribute করে: simulations, embeddings, encrypted storage pieces, verification tasks।

সকালে সেখানে কোনো rocket নেই, Wall Street story নেই, hype token নেই। শুধু একটি sober line:

এই রাত: 2.4 GPU credits earned, 18 GB-months storage confirmed, $0.31 electricity costs estimated.

পরে তুমি নিজের documents-এর ওপর local model চালাতে সেই credits use করো। Sensitive data তোমার কাছেই থাকে। তুমি শুধু customer নও। তুমি participant।

এটি romantic শোনায়। হ্যাঁ। কিন্তু কখনও কখনও সেটিই একটি difficult engineering problem সিরিয়াসভাবে নেওয়ার কারণ।

Distributed network এবং পাহাড়

আমি বিশ্বাস করি না central data centers হারিয়ে যাবে। এগুলো খুব efficient, খুব important এবং কিছু tasks-এর জন্য simply necessary। পাহাড় থাকবে। প্রশ্ন শুধু, তার পাশে আমরা আবার মাটি বানাই কি না।

Local devices, regional cells, open protocols, stable credits এবং clear security models দিয়ে তৈরি মাটি। যেখানে compute power শুধু ওপর থেকে নিচে sold হয় না, participants-এর মধ্যে flow করে। যেখানে কিছু AI work সেই জায়গায় চলে যেখানে তা belong করে: private work locally, regional work regionally, global edge cases data center-এ।

হয়তো এটি naive। হয়তো নয়। Virtual power plants-ও একসময় অদ্ভুত idea ছিল: হাজার হাজার small batteries as one large network। Decentralized money অনেক দিন absurd শোনাত। Cars autonomous taxi হিসেবে চলবে, science fiction মনে হতো। সবকিছু promised মতো আসবে না। কিন্তু direction clear: আগে passive পড়ে থাকা resources increasingly larger system-এর অংশ হিসেবে ভাবা হচ্ছে।

ঠিক এখন everywhere unused machines আছে। apartments, offices, garages, server rooms এবং pockets-এ। প্রতিটি সমান suitable নয়। প্রতিটিকে কখনও foreign work execute করা উচিত নয়। কিন্তু অনেকই already there, paid এবং networked। আর প্রতিটি unused second অদৃশ্য হয়ে যায়।

হয়তো আমাদের তাদের কথা শোনা শুরু করা উচিত।

পরের বার পর্যন্ত,
আপনাদের Joe

উৎস