Nguvu ya kompyuta isiyotumika inayotuzunguka

3 Juni 2026 • 25 min read

Jedwali la yaliyomo

Wakati mwingine swali kubwa la miundombinu huanza na picha ndogo sana: simu mahiri iko kwenye chaja usiku. Laptop imefungwa. Konsoli ya michezo inasubiri sebuleni. Gari limesimama gereji. Kila mahali kuna nguvu ya kompyuta ambayo tayari imelipiwa, inapewa umeme, na mara nyingi haifanyi chochote.

Wakati huohuo, vituo vipya vya data vinajengwa, vikubwa kama viwanda. Majengo yaliyojaa GPU, nyuzi za optiki, transfoma, mifumo ya kupoza na mikataba ya umeme. Tunajenga tabaka jipya la miundombinu ya kidijitali litakalobeba uandishi wetu, utafutaji wetu, programu zetu, uchambuzi wetu, na labda siku moja pia maamuzi yetu.

Ingekuwaje kama sehemu ndogo ya nguvu hii isingepotea tu? Si kama fantasia ya ajabu ambako kila simu ghafla inachukua nafasi ya kituo cha data. Bali kama jaribio la mawazo lenye uzito: je, kunaweza kuwa na aina ya smart grid ya compute, ambako vifaa vinachangia nguvu ya kompyuta kwa hiari, kwa mipaka, na kwa malipo?

Katika makala Kutoka PRISM hadi Prompt ninaangalia upande mwingine wa maendeleo haya: utegemezi unaokua kwa majukwaa machache ya AI, hasa kutoka Marekani na China. Hapa kinachonivutia ni wazo la kinyume. Si kama mapenzi ya P2P yasiyo na uhalisia, bali kama swali la kiufundi: ni nguvu kiasi gani ya kompyuta tayari imesambaa, ni kazi gani za AI zinaweza kugawanywa kweli, na nini kingehitajika ili watu walipwe kwa haki?

Nguvu ya kompyuta haiwezi kuhifadhiwa. Saa moja ya GPU isiyotumika si akiba. Inapotea tu.

Jaribio la mawazo

AI si programu tu. AI ni umeme, kupoza, nyuzi za optiki, GPU, ardhi, maji na mtaji. Shirika la Kimataifa la Nishati linakadiria kuwa vituo vya data duniani vilitumia takriban 415 TWh za umeme mwaka 2024, karibu asilimia 1.5 ya matumizi ya umeme duniani. Kufikia 2030, matumizi hayo huenda yakafikia karibu 945 TWh.

Hiyo si namba tu kwa ripoti za uendelevu. Hiyo ni siasa ya miundombinu. Huduma za AI zinapatikana 7x24. Kila muhtasari, kila swali la code, kila picha, kila mzunguko wa agent ni hesabu. Na watu na makampuni mabilioni wanapoweka kazi ndani ya mizunguko ya AI, hilo linakuwa mzigo wa msingi.

Ndiyo maana ninaelewa mvuto wa suluhisho kubwa za kati. Vituo vya data vinaweza kudhibitiwa: hardware sawa, racks sawa, mitandao sawa, maeneo ya usalama yaliyo wazi, SLA, monitoring, malipo. Kwa mtazamo wa uendeshaji, hilo linavutia. Lakini kisiasa, kiuchumi na kiusanifu, linaunda tena kitu kilekile kilichowahi kuifanya internet iwe rahisi kudhurika: vituo vichache vya nguvu.

Kwa hiyo jaribio hili la mawazo linaanza na swali rahisi la kinyume: nini tayari kipo kabla hatujajenga kituo kingine cha data?

Uwezo usiotumika ni mkubwa kiasi gani?

Wazo hili kwa kweli hutokea katika tukio la kila siku. Simu mahiri iko usiku kwenye meza ya pembeni ya kitanda, imeunganishwa na umeme na karibu haifanyi kitu. Lakini ndani yake kuna chip yenye nguvu ya kompyuta maalumu kwa AI kuliko kompyuta nyingi zilivyokuwa nazo kama kifurushi kizima miaka kumi iliyopita. iPhone 15 Pro yenye A17 Pro hufikia takriban trilioni 35 za operesheni za Neural Engine kwa sekunde. Hata ukichukua wastani wa tahadhari tu, hiyo ni nyingi kupita kiasi kwa kifaa kinachosubiri sehemu kubwa ya usiku.

Hali hiyo hiyo hutokea mezani. Notebook mpya hazina tena CPU na GPU tu, bali pia NPU au Neural Engine. Apple imekuwa ikiweka Neural Engine kwenye chips zake kwa miaka. Notebook za Windows zinakuja kama AI PC zenye processor maalumu za AI. Konsoli ya michezo sebuleni ina nguvu ya GPU ambayo zamani ingesikika kama workstation. Na bado tunatumia nguvu hii ya ndani ya kompyuta kwa milipuko mifupi tu: mchezo, export, video call, effect ya ndani, utafutaji. Baada ya hapo kifaa hurudi idle.

Hapo ndipo jaribio la mawazo linaanza. Si: “je, naweza kukodisha iPhone yangu kama kituo cha data kesho?” Huo ni upuuzi. Bali: kama silicon nyingi hivi tayari imelipiwa, imeunganishwa na kila usiku iko kwenye umeme, uwezo wa kinadharia ungekuwa mkubwa kiasi gani kama tungetumia tu vipindi vidogo, salama na vinavyofaa?

Hatuwezi kupima kwa usahihi nguvu yote ya kompyuta isiyotumika duniani. Vifaa ni tofauti sana, vingi viko offline, na vingi haviruhusiwi kushiriki kwa sababu za betri, joto, usalama au platform. Hata hivyo, makadirio makubwa hutusaidia kuhisi ukubwa.

Kwa hilo, tuchukue vipande vichache vilivyorahisishwa kwa makusudi. Muhimu: sihesabu kana kwamba kila kifaa kinapatikana kikamilifu kila wakati. Nahesabu kwa vipindi vya muda, viwango vya ushiriki na punguzo la tahadhari. Bado ni jaribio la mawazo, lakini lina msingi wa namba.

Tesla: silicon juu ya magurudumu

Tesla iliripoti mwezi Juni 2025 gari la milioni nane lililozalishwa. Si kila moja bado linafanya kazi, si kila moja lina hardware ileile ya Autopilot, na si kila mmiliki angefungua gari lake kwa mtandao wa kompyuta. Kwa hiyo nahesabu kwa tahadhari:

Kati ya magari milioni 8 yaliyotengenezwa, labda asilimia 80 bado yako hai kwa uhalisia na yana umuhimu wa kiufundi. Hiyo ni magari milioni 6.4.
Kwa Hardware 3, yaani FSD Computer kuanzia 2019, mara nyingi hutajwa kiwango cha takriban 144 TOPS kwa mfumo.
Hardware 4 iko kwenye magari mapya na ni ya kisasa zaidi, lakini Tesla haichapishi thamani safi na rahisi ya TOPS kama zile namba za zamani za Autonomy Day. Kwa hesabu hii, kwa hiyo, nachukua bado 144 TOPS kama thamani ya msingi ya tahadhari.
Gari linaweza kusimama masaa 23 kwa siku, lakini kinachovutia kweli ni dirisha la kuchaji. Likikaa kwenye umeme kwa masaa 6.5 usiku, kwa wastani wa masaa 24 hiyo ni karibu asilimia 27 ya upatikanaji.

Kama ni asilimia 25 tu ya wamiliki hawa wa Tesla hai wangesajili, hiyo ingekuwa magari milioni 1.6 na karibu exa-operesheni 62 kwa sekunde kama sawa ya siku nzima. Kwa ushiriki wa asilimia 50, ingekuwa karibu exa-operesheni 125 kwa sekunde. Kama kinadharia magari yote hai yangeshiriki, namba ingekuwa karibu exa-operesheni 250 kwa sekunde. Ndani ya dirisha la usiku lenyewe, nguvu ya papo hapo ingekuwa juu zaidi; namba ya sawa ya siku nzima ni ulinganisho wa haki zaidi na kituo cha data kinachokimbia masaa 24.

iPhone: mshangao mkubwa zaidi

Kwa iPhone, hesabu ni rahisi na ngumu kwa wakati mmoja. Rahisi kwa sababu Apple husafirisha idadi kubwa sana kila mwaka. Ngumu kwa sababu Apple haitoi jedwali safi la umma linaloonyesha kizazi gani cha iPhone bado kiko hai duniani. Kwa hiyo nachukua shipments zilizochapishwa za miaka ya karibuni na kuweka juu yake kiwango cha mabaki hai kinachoonekana kuwa cha busara.

Mwaka	iPhone zilizosafirishwa	mchanganyiko wa chip kwa jumla	kiwango hai kilichokadiriwa	wastani wa uwezo wa Neural Engine
2021	milioni 235.7	A14/A15	55 %	12 TOPS
2022	milioni 226.4	A15/A16	65 %	16 TOPS
2023	milioni 234.6	A16/A17 Pro	75 %	22 TOPS
2024	milioni 233.1	A16/A17/A18	85 %	30 TOPS
2025	milioni 247.8	A18/A19	95 %	32 TOPS

Hesabu hii ya mchanganyiko hutoa takriban iPhone milioni 885 ambazo huenda bado ziko hai kutoka miaka mitano tu ya usafirishaji. Huo si msingi mzima wa iPhone hai, bali kipande kilichopunguzwa kwa makusudi. Vizazi vya zamani vya A14/A15 vilikuwa kwenye eneo la chini la TOPS za tarakimu mbili, A16 karibu 17 TOPS, A17 Pro karibu 35 TOPS. Kwa hiyo wastani kwa mwaka una maana zaidi kuliko kujifanya vifaa vyote vina chip ileile.

Sasa mchezo uleule tena: masaa 6.5 usiku kwenye umeme, si siku nzima. Kama asilimia 25 ya vifaa hivi vingeshiriki, tungefikia karibu exa-operesheni 1'437 kwa sekunde kama sawa ya siku nzima. Kwa ushiriki wa asilimia 50, ingekuwa karibu exa-operesheni 2'875 kwa sekunde. Kama kinadharia vifaa vyote vingeshiriki, namba ingekuwa karibu exa-operesheni 5'750 kwa sekunde.

Hiyo inasikika wazimu. Lakini ndilo jambo lenyewe. Si kwa sababu iPhone ni server. Bali kwa sababu wingi wa vifaa ni mkubwa sana kiasi kwamba hata viwango vya tahadhari ghafla vinaingia kwenye ukubwa tunaouhusisha na vituo vya data.

Ulinganisho

Kama alama nyingine za kulinganisha, nachukua:

GPU za desktop, workstation au server ndogo milioni 50, ambazo kwa wastani zingeweza kutoa 20 TFLOPS FP32. Kama ni asilimia 20 tu zingetumika kwa vitendo, ingebaki karibu exa-operesheni 200 kwa sekunde katika vipindi vinavyofaa.
xAI Colossus kama ulinganisho kutoka dunia ya vituo vya data. Kwa GPU 200'000 za Hopper na karibu 3'958 INT8-TOPS kwa kiwango cha H100, tunafikia takriban exa-operesheni 792 kwa sekunde za kilele cha kinadharia cha AI. Hicho ni kilele cha sparsity; nguvu mnene na inayoweza kutumika muda wote iko chini.

Silicon ya kinadharia kwa kulinganisha

Makadirio makubwa ya exa-operesheni kwa sekunde, yakichukuliwa wastani wa masaa 24. Tesla na iPhone zimehesabiwa kwa dirisha la usiku la masaa 6.5; kwa Tesla na iPhone, grafu inaonyesha viwango vya ushiriki vya kinadharia, si uwezo unaopatikana leo.

Tesla 50 % kinadharia

125

PC / Workstation

200

xAI Colossus

792

iPhone 25 % kinadharia

1'437

iPhone 50 % kinadharia

2'875

Muhimu: hii si benchmark. FP32-FLOPS, INT8-TOPS na Neural-Engine-TOPS haziwezi kubadilishana 1:1. Kumbukumbu, interconnect, programu, uthibitishaji, ufanisi wa nishati, haki za platform na matumizi halisi huamua kama nguvu ya kilele inageuka kuwa kazi inayofaa.

Huu si uwezo halisi wa dunia nzima. Ni modeli ya kufikiri. Na hapa lazima tupunguze mwendo: TOPS haziwezi kumwagwa tu kama lita za maji kwenye bwawa moja. Neural-Engine-TOPS za iPhone, INT8-TOPS za GPU na nguvu ya FP32 ya workstation ni vitu tofauti. Kazi nyingi zenye maana hazihitaji operesheni za hesabu tu, bali pia RAM, VRAM, bandwidth ya memory, muda thabiti wa kukimbia, ufikiaji wa programu na mfumo wa uendeshaji unaoruhusu kazi hizo.

Hata hivyo, hesabu hii inaonyesha kwa nini wazo si la kipuuzi. Mchanganyiko wa tahadhari wa PC, magari na simu mahiri, kama silicon ya kinadharia, tayari unaingia kwenye kiwango ambacho pembeni ya mojawapo ya vituo vinavyoonekana zaidi vya AI duniani hakionekani kidogo kupita kiasi.

Namba ya iPhone inavutia hasa kwa sababu inaangalia miaka mitano tu ya usafirishaji, si msingi mzima uliosakinishwa na unaofanya kazi. Wakati huohuo ndiyo mfano bora kwa nini nguvu ya kilele haitoshi: iPhone si server. Ina mipaka ya joto, mantiki ya betri, sheria za mfumo wa uendeshaji, modeli za faragha na mmiliki anayetarajia kifaa kinachofanya kazi asubuhi. Lakini bado kuna nguvu ya kompyuta ambayo miaka michache iliyopita ingesikika kama science fiction.

Na hata thamani hizi za kilele ni thamani za kilele tu. Simu mahiri, notebook isiyo na feni au kitengo cha udhibiti wa gari haviwezi kutoa nguvu hiyo kwa masaa sita kama GPU ya kituo cha data. Joto, throttling na mantiki ya ulinzi hushusha sana utendaji endelevu. Mtu anayetaka kujenga mtandao halisi kutokana na hili lazima ahesabu sustained performance, si namba nzuri zaidi kwenye datasheet.

Tunaweza pia kufikiri kupitia umeme. Kama vifaa milioni 50 vingechangia wastani wa watt 150 kwa masaa manne kwa siku, hiyo ingekuwa takriban 11 TWh kwa mwaka. Hiyo ni sehemu ndogo tu ya matumizi ya vituo vya data duniani leo. Lakini ingetosha kubeba kazi nyingi za nyuma, embeddings, workloads za kisayansi, rendering, kazi za uthibitishaji au michakato ya storage iliyogatuliwa.

Pingamizi lisilopendeza ni hili: hilo halimaanishi moja kwa moja kuwa ni bora zaidi kiufanisi. Vituo vya data vina kupoza bora, matumizi bora, umeme wa bei nafuu, hardware mpya zaidi na batching ya kitaalamu. Kifaa cha nyumbani kinaweza kuwa kibaya zaidi kwa kila kazi ya kompyuta yenye manufaa, hasa kama overhead ni kubwa au kama betri ya simu mahiri inazeeka haraka zaidi kwa credit za senti chache. Compute grid iliyogatuliwa si nzuri kwa sababu tu imesambaa. Lazima iwe na maana kwa workloads zinazofaa: kiufundi, kiishati na kiuchumi.

Inakuwa ya kuvutia zaidi na AI PC mpya. Canalys ilitarajia takriban AI PC milioni 100 kusafirishwa mwaka 2025. Vingi kati ya vifaa hivi huja na NPU za 40 TOPS au zaidi. TOPS si sawa na GPU-FLOPS, na NPU haibadilishi kituo cha data. Lakini hata tukitazama nguvu hii kwa tahadhari kubwa, darasa jipya la hardware ya AI ya ndani linaibuka, si kwenye karatasi tu, bali katika ofisi na nyumba.

Kwa hiyo hoja si: “kesho tunabadilisha vituo vyote vya data kwa PC za michezo, Tesla na iPhone.” Hoja ni: tunajenga uwezo mkubwa sana wa kati, wakati uwezo mkubwa uliosambaa na tayari umelipiwa unapotea bila kutumika.

Nguvu ya kompyuta huharibika

Umeme naweza kuuhifadhi. Si kikamilifu, si bila hasara, lakini kimsingi inawezekana. Kama mfumo wangu wa jua mchana unazalisha zaidi ya ninachohitaji, nishati inaingia kwenye betri au grid. Jioni naweza kuitumia tena, au jirani yangu anaitumia. Smart grids, betri na modeli za nishati za peer-to-peer zinafanya njia hii ya kufikiri iwe halisi zaidi: wakati mwingine ninazalisha, wakati mwingine ninatumia, na mpaka kati ya mteja na mtoa huduma unalainika.

Nguvu ya kompyuta hufanya kazi tofauti.

Saa moja ya GPU isiyotumika jana siwezi kuitoa kwenye droo leo. Processor ambayo haikufanya chochote usiku mzima haikuhifadhi hesabu kwa baadaye. Muda huo umeenda. Hauwezi kurudi. Compute ni kitu kinachoharibika.

Hilo ndilo linalofanya vifaa visivyotumika vivutie. Hatuna hardware tu. Tuna fursa zinazopotea kila wakati. Pool ya muda mfupi yenye uhalisia hasa ni GPU za desktop, workstation, konsoli za michezo, server ndogo, storage ya NAS na rasilimali za campus au provider. Simu mahiri na magari ni zaidi hali za pembeni za muda mrefu: zinavutia kiufundi, lakini ni ngumu zaidi kwa sababu ya betri, joto, sheria za platform, usalama na udhibiti wa watengenezaji.

Kwa hiyo hali hii haikwami kwa hisabati tu, bali pia kwa motisha. Vifaa vyenye silicon ya kuvutia zaidi iliyolala ni vya majukwaa yaliyofungwa: Apple inajenga miundombinu yake ya Private Cloud Compute kwa maombi makubwa ya Apple Intelligence, Tesla inajenga uwezo wake wa training kupitia Cortex kwa FSD na Optimus. Kwa nini kampuni hizi zifungue fleet ya vifaa vyao kwa soko la compute lisilotegemea mtengenezaji, ikiwa udhibiti wa hardware, software na cloud ndiyo ngome yao ya ushindani?

Hata hivyo, swali la msingi linabaki: kwa nini tunachukulia nguvu ya kompyuta iliyosambaa kana kwamba haina umuhimu, wakati huohuo tunajenga vifaa vikubwa zaidi vya kati?

Je, kazi za AI zinaweza kugawanywa kwa njia ya ugatuzi?

Hapa lazima tuwe waaminifu: kwa mengi yanayoonekana leo kama AI, ugatuzi ni mgumu.

Modeli kubwa ya lugha si orodha tu ya kazi ndogo zinazoweza kutupwa kiholela kwa vifaa vya watu wengine. Modeli zinahitaji RAM au VRAM. Zinahitaji bandwidth ya memory. Wakati mwingine zinahitaji interconnect za haraka. Wakati wa kutengeneza token, modeli hupitishwa tena na tena, na kila hop ya ziada ya mtandao hufanya jibu liwe polepole. Kugawa modeli ya frontier juu ya simu mahiri za watu wengine, laptop za zamani na magari kwa jibu la chat la papo hapo mara nyingi ni upuuzi.

Lakini hiyo haimaanishi AI iliyogatuliwa haiwezekani. Inamaanisha tu lazima tuchague kazi sahihi.

Kazi zinazofaa sana ni zile zisizopaswa kumalizika ndani ya sekunde mbili: embeddings kwa archive kubwa, muhtasari wa batch, rendering, simulation za kisayansi, data sintetiki, majaribio, crawling, kazi za uthibitishaji, ukarabati wa storage iliyogatuliwa, modeli ndogo za ndani, preprocessing na kazi ambazo matokeo yake yanaweza kukaguliwa au kuhesabiwa mara kadhaa.

Kwa vitendo, kazi zingehitaji kutenganishwa kwa usafi zaidi:

Darasa la kazi	Lina maana kwa kugatuliwa?	Kwa nini
Inferensi binafsi ya ndani	Ndiyo, lakini ndani	Data inabaki kwenye kifaa chako au eneo lako la uaminifu.
Inferensi ya batch na embeddings	Mara nyingi ndiyo	Throughput ni muhimu zaidi kuliko latency ya sekunde.
Sehemu za kazi zinazoweza kuthibitishwa	Ndiyo, kama zinaweza kukaguliwa	Matokeo yanaweza kuhesabiwa tena, kuattest au kudhibitiwa kwa test.
Storage na replication	Ndiyo, kwa sheria	Encryption, erasure coding, audits na taratibu za ukarabati ni viungo vinavyojulikana.
Training ya frontier na SLA ngumu	Mara nyingi hapana	Coupling ni kubwa mno, VRAM nyingi mno, mahitaji ya interconnect, uendeshaji na upatikanaji ni makubwa mno.

Modeli kubwa pia hazijafungiwa nje kabisa, lakini zinahitaji usanifu mwingine. Petals imeonyesha kuwa inferensi ya ushirikiano na fine-tuning ya modeli kubwa kupitia rasilimali zilizosambaa inawezekana kimsingi. Prime Intellect inaenda hatua zaidi na INTELLECT-2 na inaonyesha jinsi reinforcement learning iliyosambazwa inaweza kufanya kazi na worker wasioweza kuaminiwa, ikiwa matokeo yanathibitishwa. Hatujafika dunia ambako iPhone yako usiku inafundisha GPT-7 kwa siri. Lakini ni ishara kwamba tatizo si kwamba haliwezekani kimsingi.

Mwanzo wa uhalisia kwa hiyo si: “tunasambaza modeli kubwa sana juu ya kila kitu.” Mwanzo wa uhalisia ni: modeli za ndani kwanza, pool za kikanda kwa batch job zinazofaa, kazi zinazoweza kuthibitishwa, maeneo ya data yaliyo wazi, na vituo vya data vya kati pale tu vinapohitajika kweli.

Ndoto ya zamani ya mifumo iliyosambazwa

Kuna simulizi nyingine ya internet. Moja inayosikika kidogo kama jumba kuu na zaidi kama kundi.

Kuhesabu kwa hiari

SETI@home kwangu ilikuwa daima moja ya mifano mizuri zaidi. Mamilioni ya watu waliacha kompyuta zao zihesabu data ya radioastronomy nyuma ya pazia. Si kwa sababu walipata dashboard ya SaaS, bali kwa sababu wazo lilikuwa kubwa vya kutosha: tunatafuta pamoja ishara ndani ya kelele ya ulimwengu. Tangu Machi 2020 SETI@home haigawi tena Work Units mpya na iko katika aina fulani ya hibernation. Lakini kama ushahidi kwamba kompyuta ya hiari inaweza kufanya kazi duniani, inabaki muhimu.

BOINC, platform iliyo nyuma yake na pembeni yake, inaeleza kwa utulivu kwa nini hili hufanya kazi: kazi nyingi huru na nzito za hesabu, ambapo throughput ni muhimu kuliko latency ya chini. Huo ndio tofauti muhimu. Mfumo uliosambazwa hauhitaji kutoa kila jibu la chat la papo hapo ndani ya sekunde mbili. Unaweza kuwa na nguvu pale kazi inapoweza kugawanywa, kukaguliwa na haidaiwi mara moja.

Storage bila mahali pa kudumu

IPFS hubeba wazo lilelile hadi eneo la storage. Faili hazielekezwi hasa kupitia mahali, bali kupitia maudhui yake. Maudhui yana alama ya kidole. Yeyote aliye nayo anaweza kuitoa. Hii ni njia tofauti ya kufikiri kuliko “faili hii iko kwenye server hii chini ya URL hii”.

Pesa bila uhasibu wa kati

Bitcoin, bila kujali kabisa jinsi tunavyotathmini uvumi na matumizi yake ya nishati, ilifanya wazo la msingi kama hilo lijulikane: mfumo bila uhasibu wa kati, ambako consensus haitegemei taasisi moja. Si kila wazo lililogatuliwa ni zuri moja kwa moja. Lakini Bitcoin ilionyesha kuwa protocol inaweza kuwa na nguvu kisiasa inapoondoa kituo cha udhibiti wa kati.

Storage kama mtandao

Katika storage pia kulikuwa na majaribio ya kuvutia. Symform ilikuwa mtoa huduma wa cloud storage iliyogatuliwa, ambako storage ya ziada ingeweza kuletwa kwenye mtandao. Mwaka 2014 platform ilinunuliwa na Quantum; wakati huo ilizungumzwa kuhusu watumiaji na biashara ndogo 45'000 katika nchi 170. Storj, Sia, Filecoin na tofauti nyingine pia zinaonyesha: wazo si jipya. Halijafika kikamilifu tu katika maisha ya kila siku.

Leo wazo hili linaishi katika maumbo mapya. Storj hukata faili upande wa client zikiwa zimefichwa na kusambaza vipande juu ya Storage Nodes nyingi. Hii iko karibu zaidi na miundombinu kuliko mapenzi ya ndoto: mtumiaji, bora kabisa, haoni kundi, bali huduma ya storage inayofanya kazi.

Compute kama soko

Golem na Akash zinataka kufanya nguvu ya kompyuta isiyotumika ipatikane kama soko. Kwangu, hii ndiyo daraja la moja kwa moja kuelekea makala hii: si nafasi ya kuhifadhi tu iliyosambaa, bali pia processor, GPU na server ndogo ambazo leo mara nyingi hukaa bila kazi.

AI ndani ya kundi lililosambazwa

Andrej Karpathy pia anaonekana tena katika mazingira haya: Prime Intellect inamtaja kama msaidizi mashuhuri, na Prime Intellect kupitia INTELLECT-2 imeanzisha raundi ya training ya RL iliyosambazwa kwa modeli ya parameter 32B, ambapo rasilimali heterogenous na permissionless za kompyuta zinaweza kuchangia.

Hilo bado si jibu kamili. Lakini linaonyesha: ndoto haijapotea. Inaendelea tu kutafuta umbo linaloweza kuishi katika uendeshaji wa kweli.

Kujifunza kutoka kituo cha umeme cha mtandaoni

Kinachovutia ni kwamba njia hii ya kufikiri kwenye sekta ya umeme haionekani tena kuwa ya ajabu sana.

Tesla inaeleza Virtual Power Plant yake kama mtandao wa vyanzo vya nishati vilivyosambaa: nyumba zenye paneli za jua na Powerwall huchukuliwa pamoja kama kituo cha umeme. Grid inapohitaji msaada, betri zinaweza kutoa umeme. Mmiliki hutoa rasilimali na hupata pesa au faida nyingine. Powerwall moja ni ndogo. Pamoja, zinaweza kuwa muhimu kwa grid.

Hiyo ndiyo analojia inayofanya compute inivutie. GPU moja kwenye home office, NAS moja, iPhone moja au gari moja si kituo cha data. Lakini vifaa vingi pamoja vinaweza kuunda tabaka jipya: si kwa kila kitu, si kila wakati, si bila sheria, lakini kwa kazi fulani.

Analojia ina mipaka. Umeme ni fungible zaidi kuliko kazi ya kompyuta. Kilowatt-saa moja haitegemei kama inatakiwa kuendesha modeli yenye 80 GB VRAM, pipeline ya embedding au repair ya storage iliyofichwa. Compute inategemea workload. Ndiyo maana inahitaji madarasa ya job, scheduling na marufuku ngumu.

Kwa Tesla, tunaona wazo hilohilo katika sehemu mbili. Powerwall zinaweza kuwa sehemu ya kituo cha umeme cha mtandaoni. Magari yanatarajiwa baadaye kuwa sehemu ya fleet ya robotaxi huru, hivyo kupata pesa wakati mmiliki hayatumii. Kama na kwa kasi gani hilo litaskeli kweli ni swali jingine. Lakini wazo la msingi ni muhimu: kifaa binafsi hakitumiki tena tu kwa matumizi ya mwenyewe, bali kinaweza kufanya kazi kama miundombinu katika vipindi vya bure.

Compute inaweza kufikiriwa vivyo hivyo. Si kama kuuza umeme kwa jirani, bali kama kuuza muda wa kompyuta unaoweza kuthibitishwa, nafasi ya storage au kazi ya modeli kwa seli ya kikanda. Mtumiaji mwishowe analipa umeme, joto, uchakavu wa hardware na hatari. Kwa hiyo lazima alipwe pia. Bila hoja hii, wazo linakuwa jaribio zuri tu la kiufundi.

Kwa nini kundi hushinda mara chache sana

Kama kugatua kunasikika vizuri hivi, kwa nini hakushindi tu?

Kwa sababu kuweka katikati mara nyingi ni kifurushi bora cha bidhaa.

Kituo cha data kinaweza kudhibitiwa. Kundi lina vifaa vya watu wengine, mifumo tofauti ya uendeshaji, upatikanaji unaobadilika, ubashiri mbaya na wamiliki wanaozima, kuuza, kusasisha au kukata kifaa kwenye mtandao. Kwa product manager, hiyo si mapenzi ya ndoto, bali maumivu ya kichwa.

Kisha kuna uchumi. Miradi mingi iliyogatuliwa imejaribu kutatua motisha kupitia token. Hilo linaeleweka, kwa sababu mtandao bila kampuni ya kati bado unahitaji malipo. Lakini gharama za storage au muda wa kompyuta zinapofungwa kwenye sarafu tete, inakuwa haivutii makampuni ya kawaida. Sitaki terabyte yangu ya backup ghafla iwe ghali zaidi kwa sababu coin fulani imepumped Twitter. Sitaki pia bajeti yangu ya saa za GPU itegemee soko linalojisikia zaidi kama kasino kuliko miundombinu.

Na mpinzani wa bei si GPU ya on-demand ghali zaidi kwenye cloud. Ulinganisho halisi ni ofa za spot na preemptible, yaani uwezo wa vituo vya data uliobaki ambao watoa huduma huuza kwa punguzo kubwa. Mtandao wa compute uliogatuliwa kwa hiyo haupaswi kuwa mzuri kifalsafa tu. Lazima ushindane na uwezo wa cloud wa bei nafuu sana, uliounganishwa vizuri, hata kama unaweza kukatishwa.

Kizuizi cha pili ni urahisi. S3 haikushinda kwa sababu ni nzuri kifalsafa. Ilishinda kwa sababu ni rahisi vya kutosha, imeandikwa vya kutosha na imeunganishwa kila mahali. Kama mitandao ya storage au compute iliyogatuliwa inataka kuwa muhimu, lazima ihisi karibu ya kuchosha kwa developer na admin: weka API key, tengeneza bucket, monitoring, invoice, SLA, restore test, basi.

Kisha usalama unakuja. Katika mtandao wa kampuni, haipaswi ghafla compute job ya mtu mwingine iingie kwenye workstation. Firewall yenye akili ingeizuia na mifumo ya threat intelligence ingeiona kuwa ya kutiliwa shaka. Kwa vitendo, mfumo kama huo ungefanya kazi zaidi kutoka ndani kwenda nje: node inajisajili kwa seli, inachukua job zilizokaguliwa, inakimbia ndani ya sandbox na inaona tu data inayoruhusiwa kuiona. Vinginevyo mtandao halali wa compute kwenye ngazi ya mtandao unaanza haraka kuonekana kama botnet iliyoandikwa kwa adabu sana.

Uaminifu ni hatua nyingine ngumu. Mifumo iliyogatuliwa lazima iweze kuthibitisha kuwa kazi imefanywa kwa usahihi bila kila node kuruhusiwa kuona kila kitu. Kwa storage kuna viungo vinavyojulikana: encryption, erasure coding, audits, taratibu za repair. Kwa AI na compute, inakuwa ngumu zaidi. Ninawezaje kukagua kama kifaa cha mtu mwingine kimeendesha modeli kwa usahihi? Ninawezaje kuzuia uvujaji wa data? Ninawezaje kulinda kifaa cha mshiriki dhidi ya code ya mtu mwingine?

Uchakavu wa hardware pia ni zaidi ya umeme. SSD na storage ya NVMe zina mipaka ya kuandika. Mtu akiandika mara kwa mara uzito wa modeli, data ya muda, batch za embedding au faili za swap kwenye vifaa vya watumiaji, anatumia maisha halisi ya kifaa. Pia kuna tatizo la bandwidth: kama kupakua modeli au dataset kubwa kunachukua muda mrefu zaidi na kuunda overhead ya mtandao kuliko hesabu yenyewe, hesabu inapinduka. Data ni nzito zaidi kuliko metafora rahisi ya smart grid inavyodokeza.

Hapo ndipo INTELLECT-2 inavutia. Katika paper yake, Prime Intellect inaeleza TOPLOC kama kiungo kinachothibitisha rollouts kutoka kwa Inference Worker wasioweza kuaminiwa. Hilo halitatui ghafla matatizo yote ya compute. Si ulinzi wa ajabu wa faragha kwa data yoyote ya kampuni kwenye hardware ya mtu mwingine. Lakini linaonyesha utaratibu halisi kwa darasa fulani la kazi ya AI iliyosambazwa: jobs hujengwa ili matokeo yakaguliwe, badala ya kumwamini kila worker kwa upofu.

Kwa data ya siri, hilo peke yake halitoshi. Hapo zinahitajika sehemu nyingine: Confidential Computing, Trusted Execution Environments, Remote Attestation, sandbox safi, uainishaji wazi wa data na, ikibidi, uamuzi mgumu kwamba baadhi ya jobs hazipaswi kukimbia kabisa kwenye hardware ya mtu mwingine. Pia kuna maswali ya kuchosha lakini muhimu: kodi, dhima, ulinzi wa data, data residency na masharti ya ISP. Miundombinu hushindwa mara chache kwa hisabati tu. Mara nyingi hushindwa kwa uendeshaji.

Compute smart grid

Sifikirii wazo la kijinga la “kila kitu ni P2P na basi kila kitu kitakuwa kizuri.” Miundombinu haifanyi kazi hivyo. Kinachoweza kufanya kazi ni compute smart grid yenye tabaka zilizo wazi.

Tabaka la kwanza linaitwa: ndani kwanza. Kila kitu cha binafsi, cha siri au kinachohitaji latency ndogo kinapaswa kukimbia kwenye kifaa chako au ndani ya eneo lako la uaminifu kadiri iwezekanavyo. Modeli ndogo, utafutaji wa ndani, muhtasari binafsi, uainishaji rahisi, preprocessing, encryption, embeddings kwa data binafsi. Si kila email, kila note na kila utafutaji lazima uende kwa hyperscaler.

Tabaka la pili lingekuwa la kikanda na federated. Mji, mtaa, campus, kampuni, ushirika au provider angeweza kuendesha seli. Katika seli hii, vifaa vinatoa rasilimali kwa hiari, lakini kwa masharti wazi tu: wakati viko kwenye umeme, wakati viko idle, ndani ya mipaka ya joto, kwa kiwango cha juu cha nguvu kilichofafanuliwa, na kwa madarasa maalumu ya job tu.

Mwanzo si simu mahiri na magari, bali vifaa vinavyoonekana vya kawaida zaidi: GPU za desktop, workstation, konsoli za michezo, server ndogo, mifumo ya NAS na uwezo huru kwa provider za karibu. Simu mahiri baadaye zinaweza kuchukua jobs ndogo za uthibitishaji. Magari yangeweza kufikiriwa baadaye zaidi, ndani ya mipaka finyu sana inayodhibitiwa na mtengenezaji. Kama kwenye grid ya umeme, lazima kwanza uanze na rasilimali zinazoaminika, zinazopimika na zinazodhibitika.

Tabaka la tatu linabaki la kati. Frontier training, muda halisi mgumu, modeli kubwa sana, kesi maalumu nyeti kikanuni na workloads zenye coupling kubwa zinaendelea kuwa ndani ya vituo vya data vya kitaalamu. Kugatua si lazima kubadilishe kila kitu. Lazima tu kuzuie kila kazi ya kila siku kupita kiotomatiki kwenye vituo vilevile vitano vya nguvu.

Kama tungetaka kujaribu, ningeanza kidogo. Si na mamilioni ya iPhone, bali na seli ya kikanda ya labda GPU za desktop za hiari 500 hadi 2'000, workstation, mifumo ya NAS na server ndogo. Zingeruhusiwa aina chache tu za job: embeddings kwa data isiyo nyeti, batch jobs za kisayansi, vipande vya storage vilivyofichwa na kazi za uthibitishaji. Mafanikio hayapimwi kwa namba nzuri ya exa, bali kwa vipimo vitatu vya kuchosha: jobs zilizomalizika kwa kila $1 ya gharama ya umeme, kiwango cha makosa na kurudia, malipo baada ya uchakavu wa hardware.

Sehemu ngumu zaidi ingekuwa malipo. Mtumiaji analipa umeme, joto na uchakavu wa hardware. Kwa hiyo anahitaji kupata kitu. Labda kweli ingehitaji token au credit. Lakini si kama kitu cha uvumi, bali kama salio la miundombinu.

Compute-credit kama hiyo lazima isimame juu ya kitu halisi: dakika moja ya GPU ya darasa fulani, GB-mwezi moja ya storage, inferensi moja iliyothibitishwa, kitengo cha batch embedding au kitengo cha hesabu sawa na kWh. Anayetoa rasilimali anapata credits. Anayehitaji nguvu ya AI baadaye anazitumia. Asiyetaka kuzitumia angeweza kuzitoa kama fiat, kama ambavyo kwenye kituo cha umeme cha mtandaoni hutaki kulipwa kwa “Powerwall-Coins”, bali kwa pesa halisi au credit iliyo wazi.

Lakini hilo halitatui swali la bei kwa uchawi. Utulivu unahitaji nanga: malipo kwa fiat, korido za bei ya nishati, vituo vya clearing vya kikanda, bei za ushirika au waendeshaji wanaodhibitiwa. Bila governance, “credits thabiti” hugeuka haraka kuwa token inayoyumba huru. Na hapo tunarudi kwenye tatizo la zamani: miundombinu inajisikia kama kasino.

La muhimu zaidi ni swali la haki za uendeshaji. Hatulazimiki kufundisha kila foundation model kubwa wenyewe. Labda tunanunua au kulicense modeli, open weights au familia za modeli, kisha tunaziendesha kwa njia iliyogatuliwa, federated na inayodhibitiwa kikanda. Ukuu halisi usingekuwa kwenye training tu, bali kwenye uendeshaji: Modeli zinakimbia wapi? Data iko wapi? Nani anaweza kufanya audit? Kuna njia ya kurudi kwa mtoa huduma? Naweza kuendelea kuendesha modeli ndani ikiwa siasa, bei au terms zinabadilika?

Ili hilo liwe zaidi ya mkataba mzuri wa ununuzi, leseni kama hizo zingehitaji haki halisi za uendeshaji: local deployments, ahadi za muda mrefu za updates na usalama, model cards zinazoeleweka, uwezo wa audit, haki wazi za kutoka na hakuna wajibu wa kurudisha data nyeti kwenye cloud ya kati ya mtengenezaji. Hilo si utopia safi iliyogatuliwa. Lakini ni njia ya uhalisia kati ya kujitosheleza kwa ujinga na platform lock-in kamili.

Usiku ambao vifaa vinahesabu

Fikiria ni saa 22:43. Desktop yako yenye GPU iko idle, NAS iko online, simu inachaji. Kwenye mipangilio umeweka: watt 80 kiwango cha juu, wakati wa idle tu, kwa workloads zilizokaguliwa kutoka eneo lako tu, na ikiwa malipo yanafunika gharama za umeme pamoja na posho ya hardware tu.

Agent wa ndani anaripoti uwezo huru. Si kwa jina lako na si kwa data yako binafsi, bali kama node iliyothibitishwa yenye uwezo fulani. Seli inasambaza jobs ndogo: simulation, embeddings, vipande vya storage vilivyofichwa, kazi za uthibitishaji.

Asubuhi hakuna roketi, hakuna hadithi ya Wall Street, hakuna hype-token. Kuna mstari mmoja tu wa kawaida:

Usiku huu: 2,4 GPU-Credits zimepatikana, GB-miezi 18 ya storage imethibitishwa, $0.31 gharama ya umeme imekadiriwa.

Baadaye unatumia credits hizi kwa modeli ya ndani juu ya nyaraka zako mwenyewe. Data nyeti inabaki kwako. Wewe si mteja tu. Wewe ni mshiriki.

Hiyo inasikika kimapenzi. Ndiyo. Lakini wakati mwingine hilo ndilo sababu ya kuchukua kwa uzito tatizo gumu la engineering.

Kundi na mlima

Siamini kwamba vituo vya data vya kati vitatoweka. Ni fanisi mno, muhimu mno na kwa kazi fulani ni vya lazima. Mlima unabaki. Swali ni tu kama pembeni yake tunajenga ardhi tena.

Ardhi iliyotengenezwa na vifaa vya ndani, seli za kikanda, protocol wazi, credits thabiti na modeli wazi za usalama. Ardhi ambako nguvu ya kompyuta haiuzwi tu kutoka juu kwenda chini, bali inatiririka kati ya washiriki. Ardhi ambako kazi fulani ya AI inakimbia pale inapostahili: kazi binafsi ndani, kazi ya kikanda kikanda, kesi za mipaka ya dunia kwenye kituo cha data.

Labda hilo ni la kijinga. Labda si. Vituo vya umeme vya mtandaoni pia zamani vilikuwa wazo la ajabu: maelfu ya betri ndogo kama mtandao mmoja mkubwa. Pesa iliyogatuliwa ilisikika kwa muda mrefu kama upuuzi. Magari yanayojiendesha kama taxi yalisikika kama science fiction. Si kila kitu kitakuja kama kilivyoahidiwa. Lakini mwelekeo uko wazi: rasilimali zilizokuwa zikisimama tu zamani zinazidi kufikiriwa kama sehemu ya mfumo mkubwa.

Hasa sasa, mashine zisizotumika ziko kila mahali. Katika nyumba, ofisi, gereji, vyumba vya server na mifukoni. Si kila moja linafaa kwa kiwango sawa. Si kila moja linapaswa kamwe kuendesha kazi ya mtu mwingine. Lakini mengi tayari yapo, yamelipiwa na yameunganishwa. Na kila sekunde isiyotumika inapotea.

Labda tunapaswa kuanza kuyasikiliza.

Tutaonana tena,
Wenu,
Joe

Vyanzo