القدرة الحاسوبية غير المستغلة من حولنا

3 يونيو 2026 • 22 min read

جدول المحتويات

أحياناً يبدأ سؤال كبير عن البنية التحتية بصورة صغيرة جداً: هاتف ذكي موضوع ليلاً على الشاحن. الحاسوب المحمول مغلق. جهاز الألعاب ينتظر في غرفة المعيشة. السيارة واقفة في المرآب. في كل مكان توجد قدرة حاسوبية دُفع ثمنها بالفعل، تحصل على الكهرباء، وغالباً لا تفعل شيئاً.

وفي الوقت نفسه تظهر مراكز بيانات جديدة بحجم منشآت صناعية. قاعات مليئة بوحدات GPU، وألياف ضوئية، ومحولات، وأنظمة تبريد، وعقود كهرباء. نحن نبني الآن طبقة جديدة من البنية التحتية الرقمية، طبقة ستحمل كتابتنا وبحثنا وبرمجتنا وتحليلنا، وربما يوماً ما قراراتنا أيضاً.

ماذا لو لم يختف جزء صغير من هذه القدرة ببساطة؟ ليس كخيال جامح، حيث يتحول كل هاتف فجأة إلى بديل لمركز بيانات. بل كتجربة فكرية جادة: هل يمكن أن توجد شبكة Compute-Smart-Grid، تساهم فيها الأجهزة طوعاً، وبحدود واضحة، وبمقابل عادل؟

في مقال من PRISM إلى Prompts أتحدث عن الجانب الآخر من هذا التطور: الاعتماد المتزايد على عدد قليل من منصات الذكاء الاصطناعي، خصوصاً من الولايات المتحدة والصين. هنا تهمني الفكرة المعاكسة. ليس كرومانسية P2P ساذجة، بل كسؤال تقني: كم من القدرة الحاسوبية موزع حولنا أصلاً، وأي مهام ذكاء اصطناعي يمكن توزيعها فعلاً، وما الذي يجب أن يحدث حتى يحصل الناس على مقابل عادل؟

لا يمكن تخزين القدرة الحاسوبية. ساعة GPU غير مستخدمة ليست احتياطياً. إنها تختفي ببساطة.

التجربة الفكرية

الذكاء الاصطناعي ليس مجرد برنامج. الذكاء الاصطناعي هو كهرباء، تبريد، ألياف ضوئية، GPUs، أرض، ماء ورأس مال. تقدّر وكالة الطاقة الدولية أن مراكز البيانات استهلكت عالمياً في 2024 نحو 415 TWh من الكهرباء، أي حوالي 1,5 في المئة من الاستهلاك العالمي. وبحلول 2030 قد تصل إلى نحو 945 TWh.

هذه ليست مجرد رقم لتقارير الاستدامة. هذه سياسة بنية تحتية. خدمات AI متاحة 7x24. كل تلخيص، وكل سؤال برمجي، وكل صورة، وكل تشغيل لوكيل، هو عملية حسابية. وعندما يضع مليارات الأشخاص والشركات أعمالهم داخل حلقات AI، يتحول ذلك إلى حمل أساسي.

لذلك أفهم جاذبية الحلول المركزية الكبيرة. مراكز البيانات قابلة للتحكم: العتاد نفسه، الرفوف نفسها، الشبكات نفسها، مناطق أمنية واضحة، SLAs، مراقبة وفوترة. من منظور التشغيل، هذا جذاب. لكنه سياسياً واقتصادياً ومعمارياً يعيد إنتاج ما جعل الإنترنت هشاً دائماً: عدد قليل من مراكز القوة.

لذلك تبدأ التجربة الفكرية بسؤال معاكس بسيط: ما الموجود بالفعل قبل أن نبني مركز البيانات التالي؟

ما حجم السعة غير المستغلة؟

الفكرة تنشأ في الحقيقة من لحظة يومية جداً. الهاتف الذكي موضوع ليلاً على الطاولة بجانب السرير، موصول بالكهرباء، ولا يفعل شيئاً تقريباً. لكن داخله شريحة لديها قدرة حاسوبية مخصصة للذكاء الاصطناعي أكبر مما كان لدى كثير من الحواسيب قبل عشر سنوات كحزمة كاملة. iPhone 15 Pro مع A17 Pro يصل إلى نحو 35 تريليون عملية Neural Engine في الثانية. حتى لو أخذنا متوسطاً حذراً فقط، فهذا رقم ضخم لجهاز ينتظر معظم الليل.

يحدث الشيء نفسه على المكتب. الحواسيب المحمولة الجديدة لم تعد تحتوي فقط على CPU و GPU، بل أيضاً على NPUs أو Neural Engines. Apple تضع Neural Engine في شرائحها منذ سنوات. حواسيب Windows المحمولة تأتي كأجهزة AI-PCs مع معالجات AI مخصصة. جهاز ألعاب في غرفة المعيشة يملك قدرة GPU كانت تبدو سابقاً كقدرة workstation. ومع ذلك نستخدم هذه القدرة المحلية غالباً في قمم قصيرة فقط: لعبة، تصدير، مكالمة فيديو، تأثير محلي، بحث. بعدها يعود الجهاز إلى وضع الخمول.

هنا تبدأ التجربة الفكرية بالضبط. ليس: “هل أستطيع غداً تأجير iPhone الخاص بي كمركز بيانات؟” هذا كلام فارغ. بل: إذا كان كل هذا السيليكون مدفوع الثمن، ومتصل بالشبكة، وموصولاً بالكهرباء كل ليلة، فما حجم السعة النظرية إذا أمكن استخدام نوافذ زمنية صغيرة وآمنة ومناسبة فقط؟

لا يمكن قياس القدرة الحاسوبية غير المستغلة في العالم بدقة. الأجهزة كثيرة ومختلفة، كثير منها غير متصل، وكثير منها لا يجوز أن يشارك لأسباب البطارية أو الحرارة أو الأمن أو المنصة. ومع ذلك تساعدنا عملية تقدير تقريبية على فهم حجم الفكرة.

لنأخذ لذلك بعض الكتل البسيطة عمداً. المهم: أنا لا أحسب كما لو أن كل جهاز متاح بالكامل في كل وقت. أنا أحسب باستخدام نوافذ زمنية، ونسب مشاركة، وخصومات حذرة. تبقى تجربة فكرية، لكنها تجربة تقف على أرقام.

Tesla: سيليكون على عجلات

أعلنت Tesla في يونيو 2025 عن إنتاج السيارة رقم ثمانية ملايين. ليست كل هذه السيارات ما زالت نشطة، وليست كلها تملك عتاد Autopilot نفسه، وليس كل مالك سيتيح سيارته لشبكة حوسبة. لذلك أحسب بشكل محافظ:

من أصل 8 ملايين سيارة منتجة، ربما تبقى 80 في المئة نشطة وذات صلة تقنية بشكل واقعي. هذا يعني 6,4 مليون سيارة.
بالنسبة إلى Hardware 3، أي FSD Computer منذ 2019، يُذكر غالباً رقم بحجم 144 TOPS للنظام.
Hardware 4 موجود في السيارات الأحدث وهو أكثر حداثة، لكن Tesla لا تنشر له قيمة TOPS نظيفة وبسيطة كما فعلت مع أرقام Autonomy Day القديمة. لذلك أستخدم هنا أيضاً 144 TOPS كأساس محافظ.
السيارة تقف غالباً 23 ساعة في اليوم، لكن نافذة الشحن هي الأكثر إثارة للاهتمام. إذا كانت موصولة بالكهرباء ليلاً لمدة 6,5 ساعات، فهذا يعادل على مدى 24 ساعة حوالي 27 في المئة من التوافر.

إذا شارك فقط 25 في المئة من مالكي Tesla النشطين هؤلاء، فسيكون لدينا 1,6 مليون سيارة ونحو 62 Exa-Operation في الثانية كمعادل يومي. عند 50 في المئة مشاركة، يصبح الرقم نحو 125 Exa-Operation في الثانية. وإذا شاركت كل السيارات النشطة نظرياً، فسيصل الرقم إلى حوالي 250 Exa-Operation في الثانية. داخل نافذة الليل نفسها ستكون القدرة اللحظية أعلى؛ رقم المعادل اليومي هو فقط المقارنة الأعدل مع مركز بيانات يعمل 24 ساعة.

iPhones: المفاجأة الأكبر

بالنسبة إلى iPhones، الحساب أسهل وأصعب في الوقت نفسه. أسهل لأن Apple تشحن كميات هائلة كل عام. وأصعب لأن Apple لا تقدم جدولاً عاماً واضحاً يبين أي أجيال iPhone ما زالت نشطة عالمياً. لذلك آخذ شحنات السنوات الأخيرة وأضع فوقها نسبة بقاء نشطة معقولة.

السنة	iPhones المشحونة	مزيج الشرائح التقريبي	نسبة النشاط المفترضة	متوسط قدرة Neural Engine
2021	235,7 مليون	A14/A15	55 %	12 TOPS
2022	226,4 مليون	A15/A16	65 %	16 TOPS
2023	234,6 مليون	A16/A17 Pro	75 %	22 TOPS
2024	233,1 مليون	A16/A17/A18	85 %	30 TOPS
2025	247,8 مليون	A18/A19	95 %	32 TOPS

ينتج عن هذا الحساب المختلط نحو 885 مليون iPhone على الأرجح ما زال نشطاً من خمس سنوات شحن فقط. هذه ليست قاعدة iPhone النشطة كلها، بل مقطع محدود عمداً. أجيال A14/A15 الأقدم كانت في نطاق TOPS منخفض ثنائي الرقم، و A16 حول 17 TOPS تقريباً، و A17 Pro حول 35 TOPS. لذلك يكون متوسط لكل سنة أكثر منطقية من التظاهر بأن كل الأجهزة تملك الشريحة نفسها.

والآن اللعبة نفسها مرة أخرى: 6,5 ساعات ليلاً على الكهرباء، وليس طوال اليوم. إذا شارك 25 في المئة من هذه الأجهزة، نصل إلى نحو 1'437 Exa-Operation في الثانية كمعادل يومي. عند 50 في المئة مشاركة، يصبح الرقم نحو 2'875 Exa-Operation في الثانية. وإذا شاركت كل الأجهزة نظرياً، فسيصل الرقم إلى حوالي 5'750 Exa-Operation في الثانية.

يبدو هذا جنونياً. لكن هذا هو المقصود بالضبط. ليس لأن iPhone خادم. بل لأن كتلة الأجهزة كبيرة جداً، حتى إن النسب الحذرة تصل فجأة إلى حجم لا نربطه عادة إلا بمراكز البيانات.

المقارنة

كنقاط مرجعية إضافية آخذ:

50 مليون Desktop-GPUs أو Workstations أو خوادم صغيرة يمكن أن تقدم في المتوسط 20 TFLOPS FP32. إذا كان 20 في المئة فقط منها قابلاً للاستخدام عملياً، يبقى نحو 200 Exa-Operation في الثانية في نوافذ زمنية مناسبة.
xAI Colossus كمقارنة من عالم مراكز البيانات. مع 200'000 Hopper-GPUs ونحو 3'958 INT8-TOPS بحجم H100، نصل إلى حوالي 792 Exa-Operation في الثانية كقدرة AI نظرية قصوى. هذا هو Sparsity-Peak؛ الأداء الكثيف والقابل للاستخدام المستمر أقل من ذلك.

السيليكون النظري في المقارنة

عمليات Exa تقريبية في الثانية، محسوبة كمتوسط على 24 ساعة. Tesla و iPhones محسوبة بنافذة ليلية قدرها 6,5 ساعات؛ وفي Tesla و iPhones تعرض الرسمة نسب مشاركة نظرية، لا سعة متاحة اليوم.

Tesla 50 % نظرياً

125

PCs / Workstations

200

xAI Colossus

792

iPhones 25 % نظرياً

1'437

iPhones 50 % نظرياً

2'875

مهم: هذا ليس Benchmark. FP32-FLOPS و INT8-TOPS و Neural-Engine-TOPS ليست قابلة للتبادل 1:1. الذاكرة، Interconnect، البرمجيات، التحقق، كفاءة الطاقة، حقوق المنصة والاستخدام الحقيقي تحدد هل تتحول القدرة القصوى إلى عمل مفيد أم لا.

هذه ليست سعة عالمية دقيقة. إنها نموذج تفكير. وهنا بالضبط يجب أن نبطئ: TOPS لا يمكن صبها ببساطة مثل لترات ماء في حوض واحد. Neural-Engine-TOPS في iPhone، و INT8-TOPS في GPU، و FP32 في Workstation أشياء مختلفة. كثير من الوظائف المفيدة لا تحتاج فقط إلى عمليات حسابية، بل إلى RAM، و VRAM، وعرض نطاق ذاكرة، ووقت تشغيل مستقر، ووصول برمجي، ونظام تشغيل يسمح أصلاً بهذه الوظائف.

ومع ذلك يوضح الحساب لماذا الفكرة ليست سخيفة. حتى مزيج محافظ من PCs، وسيارات، وهواتف ذكية يصل كسيليكون نظري إلى حجم لا يبدو صغيراً بشكل عبثي بجانب أحد أبرز مراكز بيانات AI في العالم.

رقم iPhone مثير خصوصاً لأنه ينظر فقط إلى خمس سنوات شحن، لا إلى القاعدة النشطة المثبتة كلها. وفي الوقت نفسه هو أفضل مثال على أن القدرة القصوى لا تكفي: iPhone ليس خادماً. له حدود حرارة، ومنطق بطارية، وقواعد نظام تشغيل، ونماذج خصوصية، ومالك يتوقع في الصباح جهازاً يعمل. ومع ذلك توجد هناك قدرة حاسوبية كانت قبل بضع سنوات تبدو كخيال علمي.

وحتى قيم Peak هذه ليست سوى قيم Peak. هاتف ذكي، أو حاسوب محمول بلا مروحة، أو وحدة تحكم في سيارة لا تستطيع تقديم هذه القدرة ست ساعات متواصلة كما تفعل GPU في مركز بيانات. الحرارة، والخفض التلقائي للتردد، ومنطق الحماية تضغط الأداء المستمر بشدة. من يريد بناء شبكة حقيقية من ذلك، يجب أن يحسب sustained performance، لا أجمل رقم في ورقة المواصفات.

يمكن التفكير في الأمر أيضاً عبر الكهرباء. إذا ساهم 50 مليون جهاز بمتوسط 150 واط لمدة أربع ساعات يومياً، فهذا يساوي نحو 11 TWh في السنة. إنه فقط جزء صغير من استهلاك مراكز البيانات العالمي اليوم. لكنه يكفي لحمل كثير من مهام الخلفية، وembeddings، وأعباء عمل علمية، وrendering، ومهام تحقق، أو عمليات تخزين لامركزية.

الاعتراض غير المريح هو: هذا لا يعني تلقائياً أنه أكثر كفاءة. مراكز البيانات تملك تبريداً أفضل، واستخداماً أعلى، وكهرباء أرخص، وعتاداً أحدث، وbatching احترافياً. قد يكون الجهاز المنزلي أسوأ لكل عمل حوسبة مفيد، خصوصاً إذا نشأ overhead كبير، أو إذا تقادمت بطارية هاتف ذكي أسرع مقابل بضعة سنتات من الأرصدة. لذلك لن تكون شبكة Compute لا مركزية جيدة فقط لأنها موزعة. يجب أن تكون منطقية صافية لأعباء العمل المناسبة: تقنياً، وطاقياً، واقتصادياً.

ويصبح الأمر أكثر إثارة مع AI-PCs الجديدة. توقعت Canalys لعام 2025 شحن نحو 100 مليون AI-PC. كثير من هذه الأجهزة يأتي مع NPUs بقدرة 40 TOPS أو أكثر. TOPS ليست مثل GPU-FLOPS، و NPU لا تستبدل مركز بيانات. لكن حتى إذا نظرنا إلى هذه القدرة بحذر شديد، تنشأ فئة جديدة من عتاد AI المحلي، لا توجد فقط على الورق، بل تصل إلى المكاتب والبيوت.

الخلاصة ليست إذاً: “سنستبدل غداً كل مراكز البيانات بأجهزة Gaming-PCs و Teslas و iPhones.” الخلاصة هي: نحن نبني سعة مركزية هائلة جديدة، بينما تتلاشى في الوقت نفسه كمية ضخمة من السعة الموزعة والمدفوعة الثمن وغير المستغلة.

القدرة الحاسوبية مورد زائل

أستطيع تخزين الكهرباء. ليس بشكل مثالي ولا بلا خسائر، لكن من حيث المبدأ. إذا أنتجت ألواحي الشمسية ظهراً أكثر مما أحتاجه، تذهب الطاقة إلى بطارية أو إلى الشبكة. في المساء أستطيع استخدامها مجدداً، أو يستخدمها جاري. Smart Grids، وتخزين البطاريات، ونماذج الطاقة Peer-to-Peer تجعل طريقة التفكير هذه أكثر واقعية: مرة أنتج، ومرة أستهلك، والحد بين العميل والمزود يصبح ألين.

القدرة الحاسوبية تعمل بشكل مختلف.

ساعة GPU غير مستخدمة من أمس لا أستطيع إخراجها اليوم من الدرج. معالج لم يفعل شيئاً طوال الليل لم يحتفظ بقدرة حسابية لوقت لاحق. ذلك الوقت ذهب. بلا عودة. الحوسبة مورد زائل.

وهذا بالضبط ما يجعل الأجهزة غير المستغلة مثيرة. نحن لا نملك العتاد فقط. نحن نملك فرصاً تتلاشى باستمرار. المجمّع الواقعي قصير المدى هو قبل كل شيء Desktop-GPUs، وWorkstations، وأجهزة الألعاب، والخوادم الصغيرة، وNAS، وموارد campus أو providers. الهواتف الذكية والسيارات هي حالات جانبية أبعد مدى: مذهلة تقنياً، لكنها أصعب بكثير بسبب البطارية والحرارة وقواعد المنصة والأمن وسيطرة المصنّع.

الفشل إذاً ليس في الرياضيات فقط، بل في الحافز أيضاً. الأجهزة التي تحتوي على أكثر السيليكون الخامل إثارة تنتمي تحديداً إلى منصات مغلقة: Apple تبني مع Private Cloud Compute بنية تحتية خاصة لطلبات Apple Intelligence الكبيرة، وTesla تبني مع Cortex قدرة تدريب خاصة لـ FSD وOptimus. لماذا تفتح هذه الشركات بالذات أسطول أجهزتها لسوق compute مستقل عن المصنّع، إذا كانت السيطرة على العتاد والبرمجيات والسحابة هي الخندق الحقيقي؟

ومع ذلك يبقى السؤال الأساسي: لماذا نتعامل مع القدرة الحاسوبية الموزعة كأنها غير مهمة، بينما نبني في الوقت نفسه منشآت مركزية أكبر فأكبر؟

هل يمكن للذكاء الاصطناعي أن يعمل لا مركزياً أصلاً؟

هنا يجب أن نكون صادقين: بالنسبة إلى كثير مما نراه اليوم كذكاء اصطناعي، اللامركزية صعبة.

النموذج اللغوي الكبير ليس مجرد قائمة مهام صغيرة يمكن رميها كيفما نشاء على أجهزة أشخاص غرباء. النماذج تحتاج RAM أو VRAM. تحتاج عرض نطاق ذاكرة. وتحتاج أحياناً Interconnects سريعة. عند توليد tokens، يمر النموذج مراراً، وكل قفزة شبكة إضافية تجعل الإجابة أبطأ. تفكيك Frontier-Model عبر هواتف ذكية لأشخاص آخرين، وحواسيب محمولة قديمة، وسيارات سيكون غالباً بلا معنى لإجابة دردشة تفاعلية.

لكن هذا لا يعني أن الذكاء الاصطناعي اللامركزي مستحيل. يعني فقط أن علينا اختيار المهام الصحيحة.

المناسب جداً هو العمل الذي لا يجب أن ينتهي خلال ثانيتين: embeddings لأرشيفات كبيرة، تلخيصات batch، rendering، محاكاة علمية، بيانات اصطناعية، اختبارات، crawling، مهام تحقق، إصلاح تخزين لا مركزي، نماذج محلية صغيرة، معالجة مسبقة، ومهام يمكن فحص نتائجها أو حسابها أكثر من مرة.

عملياً يجب فصل المهام بدقة أكبر:

فئة العمل	هل هي منطقية لا مركزياً؟	لماذا
الاستدلال المحلي الخاص	نعم، لكن محلياً	تبقى البيانات على الجهاز أو داخل مساحة الثقة الخاصة.
استدلال الدُفعات وEmbeddings	غالباً نعم	الإنتاجية العالية أهم من زمن استجابة بالثواني.
المهام الجزئية القابلة للتحقق	نعم، إذا أمكن فحصها	يمكن حساب النتائج أكثر من مرة، أو إثباتها، أو التحكم بها عبر الاختبارات.
التخزين والنسخ	نعم، مع قواعد	التشفير، Erasure Coding، وعمليات التدقيق، وآليات الإصلاح لبنات معروفة هنا.
Frontier-Training و SLAs صعبة	غالباً لا	ترابط كبير جداً، VRAM كثيرة جداً، ومتطلبات عالية جداً للـ Interconnect والتشغيل والتوافر.

حتى النماذج الكبيرة ليست مستبعدة بالكامل، لكنها تحتاج بنية مختلفة. أظهر Petals أن الاستدلال التعاوني وFine-Tuning للنماذج الكبيرة عبر موارد موزعة ممكن من حيث المبدأ. وتذهب Prime Intellect مع INTELLECT-2 خطوة أبعد، فتظهر كيف يمكن أن يعمل Reinforcement Learning موزع مع workers غير موثوقين، إذا تم التحقق من النتائج. هذه ليست بعد عالماً يدرّب فيه iPhone الخاص بك ليلاً GPT-7 سراً. لكنها إشارة إلى أن المشكلة ليست مستحيلة من حيث المبدأ.

لذلك سيكون البدء الواقعي ليس: “نوزع نموذجاً ضخماً على كل شيء.” البدء الواقعي سيكون: النماذج المحلية أولاً، ومجمّعات إقليمية لوظائف batch مناسبة، ومهام قابلة للتحقق، ومناطق بيانات واضحة، ومراكز بيانات مركزية فقط حيث تكون ضرورية حقاً.

الحلم القديم للأنظمة الموزعة

هناك رواية أخرى للإنترنت. رواية لا تشبه الكاتدرائية كثيراً، بل تشبه السرب.

الحوسبة التطوعية

كان SETI@home بالنسبة لي دائماً من أجمل الأمثلة. ملايين الناس تركوا حواسيبهم تحسب في الخلفية بيانات من علم الفلك الراديوي. ليس لأنهم حصلوا على SaaS-Dashboard، بل لأن الفكرة كانت كبيرة بما يكفي: نبحث معاً عن إشارات في ضجيج الكون. منذ مارس 2020 لم يعد SETI@home يوزع Work Units جديدة وهو في حالة Hibernation. لكنه يبقى مهماً كدليل على أن الحوسبة التطوعية يمكن أن تعمل عالمياً.

BOINC، المنصة خلفه وبجانبه، تشرح بهدوء لماذا يعمل ذلك: كثير من الوظائف المستقلة والكثيفة حسابياً، حيث تكون الإنتاجية أهم من زمن الاستجابة المنخفض. هذا هو الفرق الحاسم. النظام الموزع لا يحتاج إلى تقديم كل إجابة دردشة تفاعلية خلال ثانيتين. يمكن أن يكون قوياً حيث يكون العمل قابلاً للتقسيم، وقابلاً للفحص، وليس مستحقاً فوراً.

تخزين بلا مكان ثابت

يحمل IPFS الفكرة نفسها إلى مجال التخزين. الملفات لا تُعنون أساساً بمكانها، بل بمحتواها. المحتوى له بصمة. من يملكه يستطيع تقديمه. هذه طريقة تفكير مختلفة عن “هذا الملف موجود على هذا الخادم تحت هذا URL”.

مال بلا دفتر مركزي

Bitcoin، بغض النظر تماماً عن كيفية تقييم المضاربة واستهلاك الطاقة، جعل فكرة أصلية مشابهة شعبية: نظام بلا دفتر مركزي، لا يعتمد فيه الإجماع على مؤسسة واحدة. ليست كل فكرة لا مركزية جيدة تلقائياً. لكن Bitcoin أظهر أن البروتوكول يمكن أن يكون قوياً سياسياً إذا أزال نقطة التحكم المركزية.

التخزين كشبكة

في التخزين كانت هناك أيضاً محاولات مثيرة. Symform كان مزود تخزين سحابي لا مركزياً، حيث يمكن إدخال التخزين الفائض إلى شبكة. في 2014 استحوذت Quantum على المنصة؛ في ذلك الوقت كان الحديث عن 45'000 مستخدم وشركة صغيرة في 170 دولة. Storj وSia وFilecoin وغيرها تظهر كذلك: الفكرة ليست جديدة. لكنها لا تصل تماماً إلى الحياة اليومية.

اليوم تعيش هذه الفكرة بأشكال جديدة. Storj يجزئ الملفات ويشفرها من جهة العميل ويوزع القطع على كثير من Storage Nodes. هذا أقرب إلى البنية التحتية منه إلى الرومانسية: المستخدم لا يرى السرب في أفضل الأحوال، بل يرى خدمة تخزين تعمل.

الحوسبة كسوق

Golem وAkash يريدان جعل القدرة الحاسوبية غير المستغلة متاحة كسوق. هذه بالنسبة لي هي الجسر المباشر إلى هذا المقال: ليس التخزين فقط موزعاً حولنا، بل أيضاً المعالجات وGPUs والخوادم الصغيرة التي تبقى اليوم غالباً بلا عمل.

الذكاء الاصطناعي في السرب الموزع

يظهر Andrej Karpathy أيضاً في هذا السياق مرة أخرى: في Prime Intellect يُذكر كداعم بارز، وPrime Intellect أطلقت مع INTELLECT-2 جولة RL موزعة لا مركزياً لنموذج 32B-Parameter، حيث يمكن لموارد حوسبة غير متجانسة وpermissionless أن تساهم.

هذه ليست الإجابة المثالية بعد. لكنها تظهر أن الحلم لم يختف. إنه يبحث فقط مراراً عن شكل ينجو في التشغيل الحقيقي.

التعلم من محطة طاقة افتراضية

المثير أن طريقة التفكير هذه لم تعد تبدو غريبة جداً في مجال الكهرباء.

تصف Tesla محطة الطاقة الافتراضية Virtual Power Plant كشبكة من مصادر طاقة موزعة: منازل مع ألواح شمسية و Powerwalls تُعامل معاً كمحطة طاقة. عندما تحتاج الشبكة إلى دعم، تستطيع البطاريات تسليم الكهرباء. يضع المالك مورداً في الخدمة ويحصل مقابله على مال أو مزايا أخرى. كل Powerwall صغيرة وحدها. لكنها معاً قد تصبح مهمة للشبكة.

هذا هو بالضبط التشبيه الذي يثيرني في Compute. GPU واحدة في مكتب منزلي، أو NAS واحد، أو iPhone واحد، أو سيارة واحدة ليست مركز بيانات. لكن كثيراً من الأجهزة معاً يمكن أن تشكل طبقة جديدة: ليس لكل شيء، وليس في كل وقت، وليس بلا قواعد، لكن لمهام محددة.

للتشبيه حدود. الكهرباء أكثر قابلية للتبادل بكثير من العمل الحاسوبي. kWh واحدة لا تعتمد على ما إذا كانت ستشغل نموذجاً يحتاج 80 GB VRAM، أو خط معالجة للـ embeddings، أو Storage-Repair مشفر. Compute مرتبط بعبء العمل. لذلك بالضبط نحتاج فئات عمل، وScheduling، واستثناءات صارمة.

في Tesla نرى الفكرة نفسها في موضعين حتى. Powerwalls يمكن أن تصبح جزءاً من محطة طاقة افتراضية. والسيارات يُفترض مستقبلاً أن تصبح جزءاً من أسطول Robotaxi ذاتي، أي أن تربح المال عندما لا يستخدمها المالك. هل يحدث ذلك، وبأي سرعة، سؤال آخر. لكن الفكرة الأساسية مهمة: الجهاز الخاص لا يُستهلك فقط، بل يمكن أن يعمل كبنية تحتية في نوافذ الوقت الحر.

يمكن التفكير في Compute بشكل مشابه. ليس كبيع كهرباء للجار، بل كبيع وقت حوسبة قابل للتحقق، أو مساحة تخزين، أو عمل نموذج إلى خلية إقليمية. المستخدم يدفع في النهاية الكهرباء والحرارة وتآكل العتاد والمخاطر. لذلك يجب أن يحصل على تعويض. من دون هذه النقطة تصبح الفكرة مجرد تجربة تقنية جميلة.

لماذا نادراً ما يفوز السرب

إذا كانت اللامركزية تبدو جميلة هكذا، فلماذا لا تنتصر ببساطة؟

لأن المركزية غالباً تقدم حزمة المنتج الأفضل.

مركز البيانات قابل للتحكم. أما السرب فيتكون من أجهزة مملوكة للغير، وأنظمة تشغيل مختلفة، وتوافر متغير، وقابلية توقع ضعيفة، ومالكين يطفئون أجهزتهم أو يبيعونها أو يحدثونها أو يفصلونها عن الشبكة. بالنسبة إلى مدير منتج، هذا ليس رومانسية بل صداع.

تضاف إلى ذلك العوامل الاقتصادية. كثير من المشاريع اللامركزية حاولت حل الحوافز عبر tokens. هذا مفهوم، لأن شبكة بلا شركة مركزية تحتاج مع ذلك إلى تعويض. لكن بمجرد ربط تكاليف التخزين أو الحوسبة بعملة متقلبة، يصبح الأمر غير جذاب للشركات العادية. لا أريد أن يصبح Terabyte النسخ الاحتياطي فجأة أغلى لأن Coin ما جرى تضخيمها على Twitter. ولا أريد أن تعتمد ميزانية GPU-hours عندي على سوق يشعر كأنه كازينو أكثر من كونه بنية تحتية.

ومنافس السعر ليس أغلى GPU عند الطلب في السحابة. المقارنة الحقيقية هي عروض Spot وPreemptible، أي سعة مراكز البيانات الفائضة أصلاً، التي يبيعها المزودون بخصم كبير. لذلك يجب على شبكة Compute لا مركزية ألا تكون أجمل فلسفياً فقط. يجب أن تصمد أمام سعة سحابية رخيصة جداً، مدمجة جيداً، وإن كانت قابلة للانقطاع.

المكبح الثاني هو الراحة. لم ينتصر S3 لأنه جميل فلسفياً. انتصر لأنه بسيط بما يكفي، موثق بما يكفي، ومتكامل في كل مكان. إذا أرادت شبكات التخزين أو Compute اللامركزية أن تصبح مهمة، فعليها أن تبدو للمطورين والمديرين شبه مملة: أدخل API-Key، أنشئ Bucket، مراقبة، فاتورة، SLA، Restore-Test، وانتهى.

ثم يأتي الأمن. في شبكة شركة لا ينبغي أن تهبط فجأة وظيفة Compute غريبة إلى Workstations من الخارج. أي Firewall عاقل سيحظر ذلك، وسيبدو الأمر مريباً لأنظمة Threat-Intelligence. عملياً يجب أن يعمل مثل هذا النظام من الداخل إلى الخارج: العقدة تتصل بخلية، تجلب وظائف مفحوصة، تعمل داخل Sandbox، ولا ترى إلا البيانات المسموح لها برؤيتها. وإلا فستبدو شبكة Compute شرعية على مستوى الشبكة بسرعة مثل Botnet مصاغة بأدب شديد.

الثقة هي النقطة الصعبة التالية. يجب أن تستطيع الأنظمة اللامركزية إثبات أن العمل تم بشكل صحيح، من دون أن يحق لكل عقدة رؤية كل شيء. في التخزين توجد لبنات معروفة: التشفير، Erasure Coding، وعمليات التدقيق، وآليات الإصلاح. في AI وCompute يصبح الأمر أصعب. كيف أفحص أن جهازاً مملوكاً للغير نفذ نموذجاً بشكل صحيح؟ كيف أمنع تسرب البيانات؟ كيف أحمي جهاز المشارك من كود غريب؟

وتآكل العتاد أكثر من الكهرباء. SSDs وNVMe لها حدود كتابة. من يكتب model weights، وبيانات مؤقتة، وembedding batches، أو swap files باستمرار على أجهزة Consumer يستهلك عمراً حقيقياً. ويضاف إلى ذلك مشكلة bandwidth: إذا استغرق تحميل نموذج أو dataset كبير وقتاً أطول، وخلق overhead شبكياً أكبر من الحساب نفسه، تنقلب المعادلة. البيانات أثقل مما توحي به استعارة Smart-Grid البسيطة.

هنا يصبح INTELLECT-2 مثيراً. تصف Prime Intellect في ورقتها TOPLOC كلبنة تتحقق من rollouts صادرة عن Inference Workers غير موثوقين. هذا لا يحل فجأة كل مشاكل Compute. وليس خصوصية سحرية لأي بيانات شركة على عتاد مملوك للغير. لكنه يظهر آلية حقيقية لفئة محددة من عمل AI الموزع: تُبنى الوظائف بحيث تكون النتائج قابلة للفحص، بدلاً من أن نثق بكل worker ثقة عمياء.

بالنسبة إلى البيانات السرية، هذا وحده لا يكفي. نحتاج هناك لبنات أخرى: Confidential Computing، وTrusted Execution Environments، وRemote Attestation، وSandboxes نظيفة، وتصنيف بيانات واضح، وفي حالة الشك القرار الصارم بعدم تشغيل وظائف معينة على عتاد مملوك للغير أصلاً. وتضاف أسئلة مملة لكنها حاسمة: الضرائب، المسؤولية، حماية البيانات، توطين البيانات، وشروط مزودي الإنترنت. البنية التحتية نادراً ما تفشل بسبب الرياضيات فقط. غالباً تفشل بسبب التشغيل.

شبكة Compute-Smart-Grid

أنا لا أتخيل “كل شيء P2P ثم يصبح كل شيء جيداً” بشكل ساذج. البنية التحتية لا تعمل هكذا. ما قد يعمل هو Compute-Smart-Grid بطبقات واضحة.

الطبقة الأولى اسمها: المحلي أولاً. كل ما هو شخصي أو سري أو حساس للزمن يجب أن يعمل قدر الإمكان على الجهاز نفسه أو داخل مساحة الثقة الخاصة. نماذج صغيرة، بحث محلي، تلخيصات خاصة، تصنيف بسيط، معالجة مسبقة، تشفير، embeddings لبيانات شخصية. ليست كل رسالة بريد، وكل ملاحظة، وكل بحث بحاجة إلى الذهاب إلى Hyperscaler.

الطبقة الثانية ستكون إقليمية وفدرالية. مدينة، حي، campus، شركة، تعاونية أو provider يمكن أن يشغل خلية. في هذه الخلية تضع الأجهزة مواردها طوعاً، لكن بشروط واضحة: فقط عند توصيلها بالكهرباء، فقط في وضع الخمول، فقط داخل حدود الحرارة، فقط بقدرة قصوى محددة، وفقط لفئات وظائف معينة.

نقطة البداية لن تكون الهواتف الذكية والسيارات، بل الأجهزة الأكثر مللاً: Desktop-GPUs، Workstations، أجهزة ألعاب، خوادم صغيرة، أنظمة NAS وسعة حرة لدى providers محليين. يمكن للهواتف الذكية لاحقاً أن تتولى وظائف تحقق صغيرة. أما السيارات فستكون أبعد زمناً، ضمن حدود ضيقة جداً ومتحكم بها من المصنّع. تماماً كما في شبكة الكهرباء، يجب أن نبدأ أولاً بالموارد الموثوقة والقابلة للقياس والتحكم.

الطبقة الثالثة تبقى مركزية. Frontier-Training، والزمن الحقيقي الصارم، والنماذج الضخمة جداً، والحالات التنظيمية الحساسة، وأعباء العمل ذات الترابط العالي تبقى في مراكز بيانات احترافية. اللامركزية لا يجب أن تستبدل كل شيء. يجب فقط أن تمنع مرور كل عمل يومي تلقائياً عبر مراكز القوة الخمسة نفسها.

إذا أردنا اختبار ذلك، فسأبدأ صغيراً. ليس بملايين iPhones، بل بخلية إقليمية من ربما 500 إلى 2'000 Desktop-GPUs، و Workstations، وأنظمة NAS، وخوادم صغيرة تطوعية. يُسمح بعدد قليل فقط من أنواع العمل: embeddings لبيانات غير حساسة، وظائف batch علمية، قطع تخزين مشفرة، ومهام تحقق. النجاح لا يُقاس برقم Exa جميل، بل بثلاثة مؤشرات مملة: الوظائف المنجزة لكل $1 تكلفة كهرباء، معدل الأخطاء والإعادة، والتعويض بعد تآكل العتاد.

الجزء الأصعب هو التعويض. المستخدم يدفع الكهرباء والحرارة وتآكل العتاد. لذلك يحتاج شيئاً في المقابل. غالباً سنحتاج فعلاً إلى token أو credit. لكن ليس كأداة مضاربة، بل كرصيد بنية تحتية.

يجب أن يمثل Compute-Credit شيئاً حقيقياً: دقيقة GPU من فئة معينة، GB-شهر تخزين، استدلالاً موثقاً، وحدة Batch-Embedding، أو وحدة حوسبة مكافئة لـ kWh. من يعطي موارد يكسب credits. ومن يحتاج لاحقاً إلى قدرة AI يستهلكها. ومن لا يريد أن يستهلكها يمكن أن يصرفها بعملة Fiat، مثلما لا يريد أحد في محطة طاقة افتراضية أن يتقاضى “Powerwall-Coins”، بل مالاً حقيقياً أو رصيداً واضحاً.

لكن هذا لا يحل سؤال السعر سحرياً. الاستقرار يحتاج مرساة: فوترة Fiat، ممرات أسعار للطاقة، غرف مقاصة إقليمية، تعريفات تعاونيات، أو مشغلين منظمين. من دون Governance يتحول “رصيد ثابت” بسرعة إلى token حر متقلب. وعندها نعود إلى المشكلة القديمة: البنية التحتية تشعر كأنها كازينو.

الأهم من ذلك هو سؤال حقوق التشغيل. لا يجب علينا تدريب كل Foundation Model كبير بأنفسنا. ربما نشتري أو نرخص نماذج، أو أوزاناً مفتوحة، أو عائلات نماذج، ثم نشغلها لا مركزياً وفدرالياً وتحت تحكم إقليمي. السيادة الحقيقية لن تكون عندها في التدريب فقط، بل في التشغيل: أين تعمل النماذج؟ أين توجد البيانات؟ من يحق له التدقيق؟ هل يوجد قناة رجوع إلى المزود؟ هل أستطيع تشغيل النموذج محلياً لاحقاً إذا تغيرت السياسة أو الأسعار أو Terms؟

حتى يكون ذلك أكثر من عقد شراء جميل، يجب أن تحتوي هذه التراخيص على حقوق تشغيل حقيقية: local deployments، ووعود تحديث وأمن طويلة المدى، وModel Cards قابلة للفهم، وإمكانية التدقيق، وحقوق خروج واضحة، وعدم وجود إلزام بدفع البيانات الحساسة مرة أخرى إلى سحابة المصنّع المركزية. لن تكون هذه اليوتوبيا اللامركزية الخالصة. لكنها ستكون طريقاً واقعياً بين الاكتفاء الذاتي الساذج وPlatform-Lock-in الكامل.

الليلة التي تحسب فيها الأجهزة

تخيل أن الساعة 22:43. جهازك المكتبي مع GPU في وضع الخمول، وNAS متصل، والهاتف يشحن. في الإعدادات حددت: 80 واط كحد أقصى، فقط في وضع الخمول، فقط لأعباء عمل مفحوصة من المنطقة، وفقط إذا غطى التعويض تكلفة الكهرباء بالإضافة إلى بدل العتاد.

يبلغ agent محلي عن سعة حرة. ليس باسمك، ولا ببياناتك الخاصة، بل كعقدة موثقة بقدرات محددة. توزع الخلية وظائف صغيرة: محاكاة، embeddings، قطع تخزين مشفرة، ومهام تحقق.

في الصباح لا يوجد صاروخ، ولا قصة Wall Street، ولا Hype-Token. فقط سطر هادئ:

هذه الليلة: كسبت 2,4 GPU-Credits، تم تأكيد 18 GB-شهر من Storage، وقدرت تكلفة الكهرباء بـ $0.31.

لاحقاً تستخدم هذه الأرصدة لنموذج محلي فوق مستنداتك الخاصة. تبقى البيانات الحساسة عندك. أنت لست عميلاً فقط. أنت مشارك.

هذا يبدو رومانسياً. نعم. لكن أحياناً يكون هذا بالضبط سبباً لأخذ مشكلة هندسية صعبة بجدية.

السرب والجبل

لا أعتقد أن مراكز البيانات المركزية ستختفي. إنها فعالة جداً، ومهمة جداً، وضرورية ببساطة لبعض المهام. الجبل يبقى. السؤال فقط هو هل نبني بجانبه أرضاً مرة أخرى.

أرضاً من أجهزة محلية، وخلايا إقليمية، وبروتوكولات مفتوحة، وcredits مستقرة، ونماذج أمنية واضحة. أرضاً لا تُباع فيها القدرة الحاسوبية فقط من الأعلى إلى الأسفل، بل تتدفق بين المشاركين. أرضاً تعمل عليها بعض أعمال AI حيث تنتمي: العمل الخاص محلياً، والعمل الإقليمي إقليمياً، والحالات الحدودية العالمية في مركز البيانات.

ربما يكون هذا ساذجاً. وربما لا. محطات الطاقة الافتراضية كانت يوماً فكرة غريبة أيضاً: آلاف البطاريات الصغيرة كشبكة كبيرة. المال اللامركزي بدا طويلاً عبثياً. السيارات التي تقود ذاتياً كسيارات أجرة بدت كخيال علمي. لن يأتي كل ذلك كما وُعد به. لكن الاتجاه واضح: الموارد التي كانت تقف سابقاً بشكل سلبي يُعاد التفكير فيها بشكل متزايد كجزء من نظام أكبر.

وفي هذه اللحظة تحديداً، توجد آلات غير مستغلة في كل مكان. في الشقق، والمكاتب، والمرائب، وغرف الخوادم، والجيوب. ليست كلها مناسبة بالقدر نفسه. وليس كل منها يجب أن يشغل يوماً عمل شخص غريب. لكن كثيراً منها موجود بالفعل، مدفوع الثمن ومتصل. وكل ثانية غير مستخدمة تختفي.

ربما علينا أن نبدأ في الإصغاء إليها.

إلى اللقاء،
Joe

المصادر