trueNetLab logo
BN
আমাদের চারপাশে পড়ে থাকা অব্যবহৃত কম্পিউট ক্ষমতা

আমাদের চারপাশে পড়ে থাকা অব্যবহৃত কম্পিউট ক্ষমতা

22 min read
Ai Network Security

কখনও কখনও একটি বড় অবকাঠামোগত প্রশ্ন শুরু হয় খুব ছোট একটি ছবি দিয়ে: রাতে একটি স্মার্টফোন চার্জারে পড়ে আছে। ল্যাপটপ বন্ধ। গেম কনসোল বসার ঘরে অপেক্ষা করছে। গাড়ি গ্যারেজে দাঁড়িয়ে। চারদিকে কম্পিউট ক্ষমতা আছে, যা ইতিমধ্যে কেনা হয়েছে, বিদ্যুৎ পাচ্ছে এবং বেশির ভাগ সময় কিছুই করছে না।

একই সময়ে নতুন ডেটা সেন্টার তৈরি হচ্ছে, শিল্প কারখানার মতো বড়। GPU, ফাইবার, ট্রান্সফরমার, কুলিং প্রযুক্তি এবং বিদ্যুৎ চুক্তিতে ভরা হল। আমরা ডিজিটাল অবকাঠামোর একটি নতুন স্তর তৈরি করছি, যা আমাদের লেখা, খোঁজা, প্রোগ্রাম করা, বিশ্লেষণ করা এবং হয়তো একদিন সিদ্ধান্ত নেওয়াকেও বহন করবে।

যদি এই ক্ষমতার ছোট একটি অংশ শুধু নষ্ট হয়ে না যায়, তাহলে? এমন কোনো বুনো কল্পনা নয় যেখানে প্রতিটি ফোন হঠাৎ ডেটা সেন্টারের জায়গা নেয়। বরং একটি সিরিয়াস ভাবনা: এমন একটি Compute Smart Grid কি হতে পারে, যেখানে ডিভাইসগুলো স্বেচ্ছায়, সীমিতভাবে এবং পারিশ্রমিকের বিনিময়ে কম্পিউট ক্ষমতা দেয়?

PRISM থেকে Prompts প্রবন্ধে এই বিকাশের অন্য দিকটি আছে: কয়েকটি AI platform-এর ওপর ক্রমবর্ধমান নির্ভরতা, বিশেষ করে যুক্তরাষ্ট্র ও চীনের platform-এর ওপর। এখানে আমার আগ্রহ উল্টো ধারণায়। সরল P2P রোমান্টিকতা হিসেবে নয়, বরং একটি প্রযুক্তিগত প্রশ্ন হিসেবে: আসলে কত কম্পিউট ক্ষমতা ইতিমধ্যে ছড়িয়ে আছে, কোন AI কাজগুলো আদৌ ভাগ করা যায়, এবং মানুষকে ন্যায্যভাবে পারিশ্রমিক দিতে হলে কী ঘটতে হবে?

কম্পিউট ক্ষমতা সংরক্ষণ করা যায় না। অব্যবহৃত একটি GPU-hour কোনো রিজার্ভ নয়। সেটি স্রেফ হারিয়ে যায়।

ভাবনাটি

AI শুধু সফটওয়্যার নয়। AI হলো বিদ্যুৎ, কুলিং, ফাইবার, GPU, জমি, পানি এবং মূলধন। International Energy Agency অনুমান করে, 2024 সালে ডেটা সেন্টারগুলো বিশ্বজুড়ে প্রায় 415 TWh বিদ্যুৎ ব্যবহার করেছে, বৈশ্বিক বিদ্যুৎ ব্যবহারের প্রায় 1.5 শতাংশ। 2030 সালের মধ্যে এটি প্রায় 945 TWh হতে পারে।

এটি শুধু sustainability report-এর জন্য একটি সংখ্যা নয়। এটি অবকাঠামো রাজনীতি। AI services 7x24 উপলভ্য। প্রতিটি summary, প্রতিটি code question, প্রতিটি image, প্রতিটি agent run একটি calculation। আর যখন কোটি কোটি মানুষ ও কোম্পানি কাজকে AI loops-এর মধ্যে রাখে, তখন তা base load হয়ে যায়।

তাই বড় কেন্দ্রীভূত সমাধানের আকর্ষণ আমি বুঝি। ডেটা সেন্টার নিয়ন্ত্রণযোগ্য: একই hardware, একই racks, একই networks, পরিষ্কার security zones, SLAs, monitoring, billing। operations দৃষ্টিকোণ থেকে এটি আকর্ষণীয়। কিন্তু রাজনৈতিক, অর্থনৈতিক ও architectural দিক থেকে এটি আবার ঠিক সেটাই তৈরি করে যা নেটকে সবসময় ভঙ্গুর করেছে: কয়েকটি ক্ষমতার কেন্দ্র।

তাই ভাবনাটি শুরু হয় একটি সহজ পাল্টা প্রশ্ন দিয়ে: পরের ডেটা সেন্টার বানানোর আগে কী ইতিমধ্যে পড়ে আছে?

অব্যবহৃত ক্ষমতা কত বড়?

ধারণাটি আসলে খুব দৈনন্দিন একটি মুহূর্ত থেকে আসে। স্মার্টফোনটি রাতে bedside table-এ পড়ে থাকে, বিদ্যুতে যুক্ত, প্রায় কিছুই করছে না। কিন্তু ভেতরে এমন একটি chip আছে যার AI-specific compute power দশ বছর আগের অনেক computer-এর মোট ক্ষমতার চেয়েও বেশি। A17 Pro-সহ iPhone 15 Pro প্রতি সেকেন্ডে প্রায় 35 trillion Neural Engine operations করতে পারে। খুব সতর্ক একটি average নিলেও, রাতের বেশির ভাগ সময় অপেক্ষা করা একটি device-এর জন্য এটি অবিশ্বাস্যভাবে বেশি।

ডেস্কেও একই ঘটনা ঘটে। নতুন notebooks-এ এখন শুধু CPU ও GPU নেই, NPU বা Neural Engine-ও আছে। Apple বহু বছর ধরে তার chips-এ Neural Engine বসাচ্ছে। Windows notebooks AI-PCs হিসেবে dedicated AI processors নিয়ে আসছে। বসার ঘরের game console-এ এমন GPU power আছে, যা আগে workstation-এর মতো শোনাত। তবু আমরা এই local compute power সাধারণত ছোট ছোট peaks-এ ব্যবহার করি: একটি game, একটি export, একটি videocall, একটি local effect, একটি search। তারপর device আবার idle-এ ফিরে যায়।

ঠিক এখানেই ভাবনাটি শুরু হয়। প্রশ্নটি নয়: “আমি কি কাল আমার iPhone ডেটা সেন্টার হিসেবে ভাড়া দিতে পারি?” সেটি বাজে কথা। বরং: এত silicon যদি ইতিমধ্যে কেনা, networked এবং প্রতি রাতে বিদ্যুতে যুক্ত থাকে, তাহলে theoretical capacity কত বড় হবে, যদি শুধু ছোট, নিরাপদ, উপযুক্ত time windows ব্যবহার করা যায়?

বিশ্বের এই অব্যবহৃত compute power নির্ভুলভাবে মাপা যায় না। ডিভাইসগুলো খুব ভিন্ন, অনেক offline, অনেক battery, heat, security বা platform কারণে অংশ নিতেই পারে না। তবু একটি মোটামুটি হিসাব scale বোঝাতে সাহায্য করে।

তার জন্য কয়েকটি ইচ্ছাকৃতভাবে সরল block ধরা যাক। গুরুত্বপূর্ণ হলো: আমি এমনভাবে হিসাব করছি না যেন প্রতিটি device সবসময় পুরোপুরি available। আমি time windows, participation rates এবং cautious discounts ধরে গুনছি। এটি ভাবনাই থাকে, কিন্তু পায়ের নিচে কিছু সংখ্যা নিয়ে।

Tesla: চাকার ওপর Silicon

Tesla 2025 সালের জুনে আট-মিলিয়নতম উৎপাদিত vehicle জানিয়েছিল। প্রতিটি এখনও active নয়, প্রতিটিতে একই Autopilot hardware নেই, এবং প্রতিটি owner নিজের car compute network-এ দিতে চাইবে না। তাই আমি conservative হিসাব করি:

  • 8 million উৎপাদিত vehicles-এর মধ্যে হয়তো 80 percent এখনও বাস্তবসম্মতভাবে active এবং technically relevant। অর্থাৎ 6.4 million vehicles
  • Hardware 3, অর্থাৎ 2019 থেকে FSD Computer, system-এর জন্য প্রায়ই 144 TOPS order of magnitude বলা হয়।
  • Hardware 4 নতুন vehicles-এ আছে এবং modern, কিন্তু Tesla পুরনো Autonomy Day সংখ্যার মতো পরিষ্কার, সহজ TOPS value প্রকাশ করে না। তাই এই calculation-এ আমি তবু 144 TOPS conservative base value হিসেবে ধরি।
  • একটি car প্রায়ই দিনে 23 ঘণ্টা দাঁড়িয়ে থাকে, কিন্তু আসল আকর্ষণীয় অংশ হলো charging window। রাতে যদি এটি 6.5 hours power-এ থাকে, তাহলে 24 hours average-এ তা প্রায় 27 percent availability।

যদি active Tesla owners-এর মাত্র 25 percent sign up করে, তবে তা হবে 1.6 million vehicles এবং day-equivalent হিসেবে প্রায় 62 Exa operations per second50 percent participation হলে প্রায় 125 Exa operations per second। theoreticalভাবে সব active vehicles অংশ নিলে সংখ্যাটি প্রায় 250 Exa operations per second। রাতের window-তে momentary performance বেশি হবে; day-equivalent number কেবল 24 ঘণ্টা চলা data center-এর সঙ্গে fair comparison।

iPhones: বড় বিস্ময়

iPhones-এর হিসাব একসঙ্গে সহজ এবং কঠিন। সহজ, কারণ Apple প্রতি বছর বিপুল পরিমাণ device ship করে। কঠিন, কারণ Apple পরিষ্কার public table দেয় না কোন iPhone generation বিশ্বজুড়ে এখনও active। তাই আমি সাম্প্রতিক বছরগুলোর published shipments নিয়ে তার ওপর plausible active remaining rate বসাই।

বছরshipped iPhonesআনুমানিক chip mixধরা active rateগড় Neural Engine performance
2021235.7 millionA14/A1555 %12 TOPS
2022226.4 millionA15/A1665 %16 TOPS
2023234.6 millionA16/A17 Pro75 %22 TOPS
2024233.1 millionA16/A17/A1885 %30 TOPS
2025247.8 millionA18/A1995 %32 TOPS

এই mixed calculation শুধু পাঁচ shipment year থেকে প্রায় 885 million সম্ভবত এখনও active iPhones দেয়। এটি পুরো iPhone base নয়, ইচ্ছাকৃতভাবে সীমিত অংশ। পুরোনো A14/A15 generations low double-digit TOPS range-এ ছিল, A16 প্রায় 17 TOPS, A17 Pro প্রায় 35 TOPS। তাই প্রতি বছরের average নেওয়া সব devices-এর একই chip আছে বলে ধরে নেওয়ার চেয়ে যুক্তিসঙ্গত।

আবার একই খেলা: রাতে power-এ 6.5 hours, পুরো দিন নয়। এই devices-এর 25 percent অংশ নিলে day-equivalent হিসেবে প্রায় 1'437 Exa operations per second পাওয়া যায়। 50 percent participation হলে প্রায় 2'875 Exa operations per second। theoreticalভাবে সব devices অংশ নিলে সংখ্যাটি প্রায় 5'750 Exa operations per second

এটি পাগলামির মতো শোনায়। কিন্তু আসল কথাই সেটি। iPhone server বলে নয়। বরং device mass এত বড় যে cautious quotas-ও হঠাৎ এমন order of magnitude-এ পৌঁছে যায়, যা আমরা সাধারণত data centers-এর সঙ্গে যুক্ত করি।

তুলনা

আরও reference point হিসেবে নিচ্ছি:

  • 50 million desktop GPUs, workstations বা small servers, যা average-এ 20 TFLOPS FP32 দিতে পারে। এর মধ্যে শুধু 20 percent practically usable হলেও suitable time windows-এ প্রায় 200 Exa operations per second থাকে।
  • xAI Colossus data center world থেকে comparison। 200'000 Hopper GPUs এবং H100 order of magnitude-এ প্রায় 3'958 INT8-TOPS ধরলে প্রায় 792 Exa operations per second theoretical AI peak performance পাওয়া যায়। এটি sparsity peak; dense এবং continuously usable performance কম।
তাত্ত্বিক Silicon-এর তুলনা

প্রতি সেকেন্ডে মোটামুটি Exa operations, 24 ঘণ্টায় average করা। Tesla ও iPhones 6.5 ঘণ্টার রাতের window ধরে হিসাব করা; Tesla ও iPhones-এর ক্ষেত্রে graphic theoretical participation rates দেখায়, আজ ব্যবহারযোগ্য capacity নয়।

Tesla 50 % theoretical
125
PCs / Workstations
200
xAI Colossus
792
iPhones 25 % theoretical
1'437
iPhones 50 % theoretical
2'875

গুরুত্বপূর্ণ: এটি benchmark নয়। FP32-FLOPS, INT8-TOPS এবং Neural Engine TOPS 1:1 interchangeable নয়। Memory, interconnect, software, verification, energy efficiency, platform rights এবং real utilization ঠিক করে peak performance থেকে usable work তৈরি হবে কি না।

এটি কোনো exact global capacity নয়। এটি একটি thought model। আর ঠিক এখানেই থামতে হয়: TOPS-কে litre পানি মতো একটি common pool-এ ঢালা যায় না। iPhone-এর Neural Engine TOPS, GPU-এর INT8 TOPS এবং workstation-এর FP32 performance আলাদা জিনিস। অনেক useful job-এর শুধু compute operations নয়, RAM, VRAM, memory bandwidth, stable runtime, software access এবং এমন operating system দরকার যা এমন job অনুমোদন করে।

তবু হিসাবটি দেখায়, idea হাস্যকর নয়। PCs, vehicles এবং smartphones-এর একটি conservative combination theoretical Silicon হিসেবে এমন order of magnitude-এ পৌঁছায়, যা বিশ্বের সবচেয়ে visible AI data centers-এর একটির পাশে আর absurdly small লাগে না।

iPhone number বিশেষভাবে interesting, কারণ এটি শুধু পাঁচ shipment year দেখে, পুরো active installed base নয়। একই সঙ্গে এটি দেখায় কেন peak performance যথেষ্ট নয়: iPhone server নয়। এর heat limits, battery logic, operating system rules, privacy models এবং একজন owner আছে, যে সকালে একটি functioning device আশা করে। তবু সেখানে এমন compute power পড়ে আছে, যা কয়েক বছর আগেও science fiction মনে হতো।

আর এই peak values-ও শুধু peak values। Smartphone, fanless notebook বা car control unit এমন performance ছয় ঘণ্টা ধরে data center GPU-এর মতো দিতে পারে না। Thermals, throttling এবং protection logic sustained performance অনেক কমিয়ে দেয়। তাই real network বানাতে হলে datasheet-এর সবচেয়ে সুন্দর number নয়, sustained performance ধরে হিসাব করতে হবে।

এটি electricity দিয়েও ভাবা যায়। যদি 50 million devices average-এ 150 watt করে দিনে চার ঘণ্টা contribute করে, তবে বছরে প্রায় 11 TWh হয়। আজকের global data center consumption-এর ছোট অংশ। কিন্তু অনেক background jobs, embeddings, scientific workloads, rendering, verification tasks বা decentralized storage processes বহন করার জন্য যথেষ্ট।

অস্বস্তিকর আপত্তি হলো: এটি স্বয়ংক্রিয়ভাবে efficient নাও হতে পারে। Data centers-এর cooling ভালো, utilization ভালো, electricity সস্তা, hardware নতুন, batching professional। একটি home device প্রতি useful computation-এ খারাপ হতে পারে, বিশেষ করে অনেক overhead হলে বা smartphone battery কয়েক cent credit-এর জন্য দ্রুত বুড়িয়ে গেলে। তাই decentralized compute grid distributed বলেই ভালো নয়। suitable workloads-এর জন্য সেটিকে net meaningful হতে হবে: technically, energetically এবং economically।

নতুন AI-PCs এলে বিষয়টি আরও আকর্ষণীয় হয়। Canalys 2025 সালের জন্য প্রায় 100 million shipped AI-PCs আশা করেছিল। এসব devices-এর অনেকগুলিতে 40 TOPS বা তার বেশি NPU থাকে। TOPS GPU-FLOPS-এর মতো নয়, এবং NPU data center replace করে না। কিন্তু খুব সতর্কভাবে দেখলেও local AI hardware-এর নতুন class তৈরি হচ্ছে, যা শুধু paper-এ নয়, offices ও homes-এ পৌঁছাচ্ছে।

সুতরাং মূল কথা এটি নয়: “আমরা কাল সব data center gaming PCs, Teslas এবং iPhones দিয়ে replace করব।” মূল কথা হলো: আমরা বিশাল নতুন central capacity তৈরি করছি, যখন একই সময়ে বিপুল distributed, already paid capacity unused হয়ে নষ্ট হচ্ছে।

কম্পিউট ক্ষমতা পচে যায়

বিদ্যুৎ আমি store করতে পারি। perfect নয়, lossless নয়, কিন্তু মূলত পারি। আমার solar system দুপুরে প্রয়োজনের চেয়ে বেশি produce করলে energy battery বা grid-এ যায়। সন্ধ্যায় আমি সেটি আবার ব্যবহার করতে পারি, অথবা আমার প্রতিবেশী ব্যবহার করতে পারে। Smart grids, battery storage এবং peer-to-peer energy models এই ভাবনাকে আরও concrete করছে: কখনও আমি produce করি, কখনও consume করি, এবং customer ও provider-এর সীমা নরম হয়।

কম্পিউট ক্ষমতা ভিন্নভাবে কাজ করে।

গতকালের অব্যবহৃত GPU-hour আজ drawer থেকে বের করা যায় না। যে processor পুরো রাত কিছু করেনি, সে ভবিষ্যতের জন্য compute জমিয়ে রাখেনি। সময়টি চলে গেছে। ফেরে না। Compute পচনশীল।

ঠিক এ কারণেই unused devices interesting। আমাদের শুধু hardware নেই। আমাদের ক্রমাগত নষ্ট হয়ে যাওয়া opportunities আছে। short-term realistic pool হলো বিশেষ করে desktop GPUs, workstations, game consoles, small servers, NAS storage এবং campus বা provider resources। Smartphones ও cars বেশি long-term edge cases: technically fascinating, কিন্তু battery, heat, platform rules, security এবং manufacturer control-এর কারণে অনেক বেশি difficult।

সমস্যা তাই শুধু mathematics-এ নয়, incentive-এও। সবচেয়ে interesting idle Silicon থাকা devices আসলে closed platforms-এর: Apple বড় Apple Intelligence requests-এর জন্য Private Cloud Compute দিয়ে নিজের infrastructure বানায়, Tesla FSD ও Optimus-এর জন্য Cortex দিয়ে নিজের training capacity। hardware, software এবং cloud-এর control যদি আসল moat হয়, তবে এই companies কেন তাদের device fleet manufacturer-independent compute market-এর জন্য খুলবে?

তবু মূল প্রশ্ন থাকে: আমরা distributed compute power-কে irrelevant হিসেবে কেন দেখি, যখন একই সঙ্গে ক্রমেই বড় central facilities বানাচ্ছি?

AI কি আদৌ decentralized ভাবে compute করতে পারে?

এখানে সৎ হতে হবে: আজ visible AI-এর অনেক কিছুর জন্য decentralization কঠিন।

একটি বড় language model ছোট tasks-এর simple list নয়, যা যেকোনো foreign devices-এ ছুড়ে দেওয়া যায়। Models-এর RAM বা VRAM দরকার। memory bandwidth দরকার। কখনও fast interconnects দরকার। Token generation-এ model বারবার run হয়, এবং প্রতিটি extra network hop response ধীর করে। interactive chat answer-এর জন্য একটি frontier model বিদেশি smartphones, পুরোনো laptops ও cars-এ ভাগ করা সাধারণত অর্থহীন।

কিন্তু এর মানে decentralized AI অসম্ভব নয়। মানে শুধু সঠিক tasks বেছে নিতে হবে।

যেসব কাজ দুই seconds-এ শেষ হতে হবে না, সেগুলো ভালো fit: বড় archives-এর embeddings, batch summaries, rendering, scientific simulations, synthetic data, tests, crawling, verification tasks, decentralized storage repair, small local models, preprocessing এবং এমন tasks যেখানে results check করা বা multiple times compute করানো যায়।

বাস্তবে tasks আরও পরিষ্কারভাবে আলাদা করতে হবে:

Job classDecentralizedভাবে যুক্তিসঙ্গত?কেন
Private local inferenceহ্যাঁ, কিন্তু localData নিজের device বা নিজের trust space-এ থাকে।
Batch inference এবং embeddingsপ্রায়ই হ্যাঁseconds latency-এর চেয়ে high throughput বেশি গুরুত্বপূর্ণ।
Verifiable subjobsহ্যাঁ, যদি checkable হয়Results multiple times compute, attest বা tests দিয়ে verify করা যায়।
Storage এবং replicationহ্যাঁ, rules সহEncryption, erasure coding, audits এবং repair mechanisms এখানে known building blocks।
Frontier training এবং hard SLAsবরং নাখুব বেশি coupling, খুব বেশি VRAM, interconnect, operation ও availability requirements অনেক বেশি।

Large models পুরোপুরি excluded নয়, কিন্তু অন্য architecture দরকার। Petals দেখিয়েছে distributed resources দিয়ে বড় models-এর collaborative inference এবং fine-tuning মূলত সম্ভব। Prime Intellect INTELLECT-2 দিয়ে আরও এক ধাপ এগিয়ে দেখিয়েছে, untrusted workers দিয়ে distributed Reinforcement Learning কীভাবে কাজ করতে পারে, যদি results verify করা হয়। এটি এখনও সেই পৃথিবী নয় যেখানে তোমার iPhone রাতে গোপনে GPT-7 train করে। কিন্তু এটি ইঙ্গিত দেয় যে problem fundamentally impossible নয়।

তাই realistic start হবে না: “আমরা একটি huge model সবকিছুর ওপর distribute করি।” realistic start হবে: local models first, suitable batch jobs-এর জন্য regional pools, verifiable tasks, clear data zones এবং central data centers শুধু যেখানে সত্যিই দরকার।

Distributed systems-এর পুরোনো স্বপ্ন

Internet-এর আরেকটি গল্প আছে। যেটি cathedral-এর চেয়ে distributed swarm-এর মতো বেশি শোনায়।

স্বেচ্ছাসেবী compute

SETI@home আমার কাছে সবসময় সবচেয়ে সুন্দর উদাহরণগুলোর একটি। Millions of people তাদের computers-কে background-এ radio astronomy data calculate করতে দিয়েছিল। এজন্য নয় যে তারা SaaS dashboard পেয়েছিল, বরং idea যথেষ্ট বড় ছিল: আমরা সবাই মিলে universe-এর noise-এ signals খুঁজি। March 2020 থেকে SETI@home নতুন Work Units distribute করছে না এবং এক ধরনের hibernation-এ আছে। কিন্তু voluntary computing global scale-এ কাজ করতে পারে তার proof হিসেবে এটি গুরুত্বপূর্ণ।

BOINC, এর পেছনের ও পাশের platform, soberভাবে বলে কেন এটি কাজ করে: অনেক independent, compute-intensive jobs, যেখানে throughput low latency-এর চেয়ে বেশি গুরুত্বপূর্ণ। এটিই decisive difference। distributed system-কে প্রতিটি interactive chat answer দুই seconds-এ deliver করতে হবে না। এটি শক্তিশালী হতে পারে যেখানে work divisible, verifiable এবং immediately due নয়।

নির্দিষ্ট জায়গা ছাড়া storage

IPFS একই ভাবনাকে storage field-এ নিয়ে যায়। Files primarily কোনো place দিয়ে নয়, content দিয়ে addressed হয়। Content-এর fingerprint থাকে। যার কাছে content আছে, সে deliver করতে পারে। এটি “এই file এই server-এ এই URL-এর নিচে আছে” ভাবনা থেকে আলাদা।

Central bookkeeping ছাড়া money

Bitcoin, speculation এবং energy consumption-কে যেভাবেই বিচার করা হোক, একটি similar original idea popular করেছে: central bookkeeping ছাড়া system, যেখানে consensus কোনো single institution-এর ওপর নির্ভর করে না। প্রতিটি decentralized idea automatically ভালো নয়। কিন্তু Bitcoin দেখিয়েছে, central control point সরালে protocol politically powerful হতে পারে।

Network হিসেবে storage

Storage-এও interesting attempts ছিল। Symform ছিল decentralized cloud storage provider, যেখানে excess storage network-এ যোগ করা যেত। 2014 সালে platform Quantum acquired করে; তখন 170 countries-এ 45'000 users এবং small businesses-এর কথা বলা হয়েছিল। Storj, Sia, Filecoin এবং অন্যান্য variants-ও দেখায়: idea নতুন নয়। এটি শুধু everyday life-এ পুরোপুরি পৌঁছায় না।

আজ idea নতুন forms-এ বেঁচে আছে। Storj files client-side encrypted করে টুকরো করে অনেক Storage Nodes-এ distribute করে। এটি romance-এর চেয়ে infrastructure-এর কাছাকাছি: user ideally swarm দেখে না, বরং কাজ করা একটি storage service দেখে।

Marketplace হিসেবে compute

Golem এবং Akash unused compute power marketplace হিসেবে accessible করতে চায়। আমার কাছে এটি এই article-এর direct bridge: শুধু storage space নয়, processors, GPUs এবং small servers-ও distributed পড়ে আছে, যা আজ অনেক সময় idle থাকে।

Distributed swarm-এ AI

Andrej Karpathy-ও এই environment-এ আবার দেখা যায়: Prime Intellect-এ তাঁকে prominent supporter বলা হয়, এবং Prime Intellect INTELLECT-2 দিয়ে 32B-parameter model-এর decentralized distributed RL training round শুরু করেছে, যেখানে heterogeneous, permissionless compute resources contribute করতে পারে।

এটি এখনও perfect answer নয়। কিন্তু দেখায়: স্বপ্ন হারিয়ে যায়নি। এটি শুধু বারবার এমন form খুঁজছে, যা real operation-এ survive করতে পারে।

Virtual power plant থেকে শেখা

Interesting হলো, electricity sector-এ এই ভাবনা এখন আর এত exotic শোনায় না।

Tesla তার Virtual Power Plant-কে distributed energy sources-এর network হিসেবে describe করে: solar systems এবং Powerwalls-সহ homes একসঙ্গে power plant-এর মতো বিবেচিত হয়। Grid-এর support দরকার হলে batteries electricity দিতে পারে। Owner resource provide করে এবং তার জন্য money বা other benefits পায়। individual Powerwalls ছোট। একসঙ্গে তারা grid-এর জন্য relevant হতে পারে।

Compute নিয়ে এই analogy-ই আমাকে fascinate করে। Home office-এর একটি GPU, একটি NAS, একটি iPhone বা একটি car data center নয়। কিন্তু many devices together নতুন layer তৈরি করতে পারে: সবকিছুর জন্য নয়, সবসময় নয়, rules ছাড়া নয়, কিন্তু নির্দিষ্ট tasks-এর জন্য।

Analogy-র limits আছে। Electricity compute work-এর চেয়ে অনেক বেশি fungible। একটি kilowatt-hour এই প্রশ্নে নির্ভর করে না যে সেটি এখন 80 GB VRAM model, embedding pipeline নাকি encrypted storage repair চালাবে। Compute workload-dependent। তাই job classes, scheduling এবং hard exclusions দরকার।

Tesla-তে একই thought দুটো জায়গায় দেখা যায়। Powerwalls virtual power plant-এর অংশ হতে পারে। Cars ভবিষ্যতে autonomous Robotaxi fleet-এর অংশ হওয়ার কথা, অর্থাৎ owner যখন নিজে ব্যবহার করছেন না তখন money earn করবে। এটি সত্যিই কত দ্রুত scale করবে, আলাদা প্রশ্ন। কিন্তু basic idea important: private device আর শুধু consumed নয়, free time windows-এ infrastructure হিসেবে কাজ করতে পারে।

Compute-ও similarly ভাবা যেতে পারে। প্রতিবেশীকে electricity বিক্রি হিসেবে নয়, বরং regional cell-কে verifiable compute time, storage space বা model work বিক্রি হিসেবে। User শেষ পর্যন্ত electricity, heat, hardware wear এবং risk দেয়। তাই তাকে compensated হতে হবে। এই point ছাড়া idea শুধু সুন্দর technical experiment হয়ে থাকে।

Distributed model এত কম কেন জেতে

Decentralization এত সুন্দর শোনালে, সেটি সহজেই জেতে না কেন?

কারণ centralization প্রায়ই ভালো product package দেয়।

Data center নিয়ন্ত্রণযোগ্য। Distributed pool তৈরি হয় foreign devices, different operating systems, changing availability, poor predictability এবং এমন owners দিয়ে, যারা device off করতে, sell করতে, update করতে বা network থেকে disconnect করতে পারেন। Product manager-এর কাছে এটি romance নয়, সরাসরি মাথাব্যথা।

তার সঙ্গে economics আসে। অনেক decentralized projects incentives token দিয়ে solve করার চেষ্টা করেছে। বিষয়টি বোঝা যায়, কারণ central company ছাড়া network-এ compensation দরকার। কিন্তু storage বা compute time-এর cost volatile currency-র সঙ্গে যুক্ত হলেই normal companies-এর জন্য তা unattractive হয়। আমি চাই না আমার terabyte backup হঠাৎ expensive হয়ে যাক কারণ Twitter-এ কোনো coin pump হচ্ছে। GPU-hours budget-ও এমন market-এর ওপর depend করুক চাই না, যা infrastructure-এর চেয়ে casino-এর মতো লাগে।

আর দামের আসল প্রতিপক্ষ cloud-এর সবচেয়ে expensive on-demand GPU নয়। সত্যিকারের comparison হলো Spot এবং Preemptible offers, অর্থাৎ data center providers-এর already excess capacity, যা তারা significant discount-এ বিক্রি করে। decentralized compute network-কে তাই শুধু philosophically prettier হলেই হবে না। তাকে very cheap, well-integrated, যদিও interruptible, cloud capacity-এর বিরুদ্ধে টিকতে হবে।

দ্বিতীয় brake হলো convenience। S3 philosophically beautiful বলে জেতেনি। এটি জিতেছে কারণ enough simple, enough documented এবং everywhere integrated ছিল। decentralized storage বা compute networks relevant হতে চাইলে developers ও admins-এর কাছে প্রায় boring লাগতে হবে: API key দাও, bucket বানাও, monitoring, invoice, SLA, restore test, done।

এরপর security। Enterprise network-এ হঠাৎ কোনো foreign compute job inbound হয়ে workstations-এ land করা উচিত নয়। যেকোনো sensible firewall এটি block করবে এবং Threat Intelligence systems suspicious ভাববে। বাস্তবে এমন system-কে ভিতর থেকে বাইরে কাজ করতে হবে: node কোনো cell-এ report করে, checked jobs নেয়, sandbox-এ run করে এবং শুধু সেই data দেখে যা দেখার অনুমতি আছে। নইলে legitimate compute network network layer-এ দ্রুত খুব politely formulated botnet-এর মতো দেখাবে।

Trust হলো পরের কঠিন point। Decentralized systems-কে prove করতে হবে যে work correctly done হয়েছে, কিন্তু প্রতিটি node-কে সবকিছু না দেখিয়ে। Storage-এ known building blocks আছে: encryption, erasure coding, audits, repair mechanisms। AI এবং compute-এ এটি কঠিন। কীভাবে check করব foreign device model correctly execute করেছে? data leakage কীভাবে আটকাব? participant-এর device foreign code থেকে কীভাবে protect করব?

Hardware wear শুধু electricity নয়। SSDs এবং NVMe storage-এর write limits আছে। কেউ যদি model weights, temporary data, embedding batches বা swap files consumer devices-এ ক্রমাগত লেখে, তবে real lifetime খরচ হয়। Bandwidth problem-ও আছে: যদি large model বা dataset download করতে actual calculation-এর চেয়ে বেশি সময় ও network overhead লাগে, হিসাব উল্টে যায়। Data simple Smart Grid metaphor যা বোঝায় তার চেয়ে heavy।

ঠিক এখানে INTELLECT-2 interesting। Prime Intellect তার paper-এ TOPLOC-কে এমন building block হিসেবে describe করে, যা untrusted inference workers-এর rollouts verify করে। এটি হঠাৎ সব compute problems solve করে না। foreign hardware-এ arbitrary company data-এর জন্য এটি magical privacy নয়। কিন্তু distributed AI work-এর একটি specific class-এর জন্য real mechanism দেখায়: jobs এমনভাবে built হয় যাতে results verifiable হয়, প্রতিটি worker-কে blind trust করার বদলে।

Confidential data-এর জন্য এটি alone enough নয়। সেখানে অন্য building blocks দরকার: Confidential Computing, Trusted Execution Environments, Remote Attestation, clean sandboxes, clear data classification এবং doubt হলে hard decision যে কিছু jobs foreign hardware-এ চলবেই না। এর সঙ্গে boring কিন্তু decisive প্রশ্ন আসে: tax, liability, privacy, data residency এবং internet providers-এর terms। Infrastructure rarely শুধু mathematics-এ fail করে। প্রায়ই operations-এ fail করে।

একটি Compute Smart Grid

আমি কোনো naive “সবকিছু P2P এবং তারপর সব ভালো” কল্পনা করছি না। Infrastructure এভাবে কাজ করে না। যা কাজ করতে পারে, তা হলো পরিষ্কার layers-সহ Compute Smart Grid।

প্রথম layer: local first। যা personal, confidential বা latency-critical, যতটা সম্ভব নিজের device বা নিজের trust space-এ চলা উচিত। Small models, local search, private summaries, simple classification, preprocessing, encryption, personal data-এর embeddings। প্রতিটি email, note এবং search hyperscaler-এ যেতে হবে না।

দ্বিতীয় layer regional এবং federated। একটি city, neighborhood, campus, company, cooperative বা provider একটি cell চালাতে পারে। এই cell-এ devices voluntarily resources provide করবে, কিন্তু clear conditions-সহ: শুধু power-এ, শুধু idle-এ, শুধু thermal limits-এর ভেতরে, শুধু defined maximum power-সহ, শুধু specific job classes-এর জন্য।

Starting point smartphones এবং cars নয়, বরং boring devices: desktop GPUs, workstations, game consoles, small servers, NAS systems এবং local providers-এর spare capacity। Smartphones পরে small verification jobs নিতে পারে। Cars আরও পরে conceivable, very narrow manufacturer-controlled limits-এ। electricity grid-এর মতোই প্রথমে reliable, measurable এবং controllable resources দিয়ে শুরু করতে হবে।

তৃতীয় layer central থাকে। Frontier training, hard real time, extremely large models, regulatory sensitive special cases এবং highly coupled workloads professional data centers-এ belong করে। Decentralization সব replace করতে হবে না। শুধু প্রতিটি everyday task যেন automatically একই পাঁচ power centers দিয়ে না যায়, সেটি আটকাতে হবে।

এটি test করতে হলে, আমি ছোট শুরু করতাম। millions of iPhones নয়, বরং 500 থেকে 2'000 voluntary desktop GPUs, workstations, NAS systems এবং small servers-এর regional cell। Allowed job types খুব কম: non-sensitive data-এর embeddings, scientific batch jobs, encrypted storage pieces এবং verification tasks। Success মাপা হবে কোনো pretty Exa number দিয়ে নয়, তিনটি boring metrics দিয়ে: completed jobs per $1 electricity cost, error and repeat rate, hardware wear-এর পর payout।

সবচেয়ে কঠিন অংশ compensation। User electricity, heat এবং hardware wear দেয়। তাই তার কিছু ফেরত দরকার। সম্ভবত সত্যিই token বা credit দরকার। কিন্তু speculation object হিসেবে নয়, infrastructure balance হিসেবে।

এমন Compute Credit কোনো real জিনিসের প্রতিনিধিত্ব করতে হবে: নির্দিষ্ট class-এর GPU minute, GB-month storage, verified inference, batch embedding unit বা kWh-equivalent compute unit। যে resources দেয়, credits earn করে। পরে যে নিজের AI power দরকার, সে তা spend করে। যে consume করতে চায় না, সে fiat-এ cash out করতে পারে, যেমন virtual power plant-এ কেউ “Powerwall Coins” নয়, real money বা clear credit পেতে চায়।

তাতে pricing question magically solved হয় না। Stability-র anchor দরকার: fiat billing, energy price corridors, regional clearing houses, cooperative tariffs বা regulated operators। Governance ছাড়া “stable credits” দ্রুত free-floating token হয়ে যায়। আর তখন পুরোনো problem ফিরে আসে: infrastructure casino-এর মতো লাগে।

আরও গুরুত্বপূর্ণ operating rights-এর প্রশ্ন। প্রতিটি বড় foundation model নিজে train করতে হবে না। হয়তো models, open weights বা model families কেনা বা license করা হবে এবং তারপর decentralized, federated ও regionally controlledভাবে operate করা হবে। আসল sovereignty তখন শুধু training-এ নয়, operation-এ: models কোথায় চলে? data কোথায় থাকে? কে audit করতে পারে? provider-এর back channel আছে? politics, prices বা terms বদলালে আমি কি model locally চালিয়ে যেতে পারি?

এটি যেন শুধু সুন্দর purchase contract না হয়, তাই এমন licenses-এ real operating rights থাকতে হবে: local deployments, long-term update and security commitments, traceable model cards, auditability, clear exit rights এবং sensitive data আবার central manufacturer cloud-এ ঠেলে দেওয়ার বাধ্যবাধকতা না থাকা। এটি pure decentralized utopia নয়। কিন্তু naive self-sufficiency এবং total platform lock-in-এর মাঝখানে realistic path।

যে রাতে devices compute করে

ভাবো, রাত 22:43। GPU-সহ তোমার desktop idle, NAS online, phone charging। Settings-এ তুমি ঠিক করেছ: maximum 80 watts, only idle, শুধু region-এর checked workloads-এর জন্য এবং শুধু compensation electricity costs plus hardware allowance cover করলে।

একটি local agent free capacity report করে। তোমার নাম দিয়ে নয়, private data দিয়ে নয়, বরং নির্দিষ্ট capabilities-সহ attested node হিসেবে। Cell ছোট jobs distribute করে: simulations, embeddings, encrypted storage pieces, verification tasks।

সকালে সেখানে কোনো rocket নেই, Wall Street story নেই, hype token নেই। শুধু একটি sober line:

এই রাত: 2.4 GPU credits earned, 18 GB-months storage confirmed, $0.31 electricity costs estimated.

পরে তুমি নিজের documents-এর ওপর local model চালাতে সেই credits use করো। Sensitive data তোমার কাছেই থাকে। তুমি শুধু customer নও। তুমি participant।

এটি romantic শোনায়। হ্যাঁ। কিন্তু কখনও কখনও সেটিই একটি difficult engineering problem সিরিয়াসভাবে নেওয়ার কারণ।

Distributed network এবং পাহাড়

আমি বিশ্বাস করি না central data centers হারিয়ে যাবে। এগুলো খুব efficient, খুব important এবং কিছু tasks-এর জন্য simply necessary। পাহাড় থাকবে। প্রশ্ন শুধু, তার পাশে আমরা আবার মাটি বানাই কি না।

Local devices, regional cells, open protocols, stable credits এবং clear security models দিয়ে তৈরি মাটি। যেখানে compute power শুধু ওপর থেকে নিচে sold হয় না, participants-এর মধ্যে flow করে। যেখানে কিছু AI work সেই জায়গায় চলে যেখানে তা belong করে: private work locally, regional work regionally, global edge cases data center-এ।

হয়তো এটি naive। হয়তো নয়। Virtual power plants-ও একসময় অদ্ভুত idea ছিল: হাজার হাজার small batteries as one large network। Decentralized money অনেক দিন absurd শোনাত। Cars autonomous taxi হিসেবে চলবে, science fiction মনে হতো। সবকিছু promised মতো আসবে না। কিন্তু direction clear: আগে passive পড়ে থাকা resources increasingly larger system-এর অংশ হিসেবে ভাবা হচ্ছে।

ঠিক এখন everywhere unused machines আছে। apartments, offices, garages, server rooms এবং pockets-এ। প্রতিটি সমান suitable নয়। প্রতিটিকে কখনও foreign work execute করা উচিত নয়। কিন্তু অনেকই already there, paid এবং networked। আর প্রতিটি unused second অদৃশ্য হয়ে যায়।

হয়তো আমাদের তাদের কথা শোনা শুরু করা উচিত।

পরের বার পর্যন্ত,
আপনাদের Joe

উৎস