Неиспользуемая вычислительная мощность вокруг нас

3 июня 2026 г. • 23 min read

Содержание

Иногда большой инфраструктурный вопрос начинается с совсем маленькой картины: смартфон ночью лежит на зарядке. Ноутбук закрыт. Игровая консоль ждет в гостиной. Машина стоит в гараже. Везде есть вычислительная мощность, которая уже оплачена, получает питание и большую часть времени ничего не делает.

Одновременно появляются новые дата-центры размером с промышленные комплексы. Залы, полные GPU, оптоволокна, трансформаторов, систем охлаждения и договоров на электроэнергию. Мы прямо сейчас строим новый слой цифровой инфраструктуры, который должен поддерживать наше написание текстов, поиск, программирование, анализ и, возможно, когда-нибудь даже принятие решений.

Что, если хотя бы малая часть этой мощности не исчезала просто так? Не как дикая фантазия, где каждый телефон внезапно заменяет дата-центр. А как серьезный мысленный эксперимент: могла бы существовать своего рода compute smart grid, где устройства добровольно, ограниченно и за вознаграждение предоставляют вычислительную мощность?

В статье От PRISM к промптам речь идет о другой стороне этой тенденции: растущей зависимости от немногих ИИ-платформ, прежде всего из США и Китая. Здесь меня интересует противоположная идея. Не как наивная P2P-романтика, а как технический вопрос: сколько вычислительной мощности уже распределено вокруг нас, какие ИИ-задачи вообще можно распределять и что должно произойти, чтобы люди получали за это справедливую оплату?

Вычислительную мощность нельзя хранить. Неиспользованный GPU-час не является резервом. Он просто исчезает.

Мысленный эксперимент

ИИ - это не просто программное обеспечение. ИИ - это электричество, охлаждение, оптоволокно, GPU, земля, вода и капитал. Международное энергетическое агентство оценивает, что дата-центры в 2024 году потребили по всему миру около 415 TWh электроэнергии, примерно 1,5 процента глобального потребления. К 2030 году это может вырасти примерно до 945 TWh.

Это не просто число для отчетов об устойчивом развитии. Это инфраструктурная политика. ИИ-сервисы доступны 24/7. Каждое резюме, каждый вопрос по коду, каждое изображение, каждый запуск агента - это вычисление. И когда миллиарды людей и компаний помещают работу в ИИ-циклы, это превращается в базовую нагрузку.

Поэтому я понимаю привлекательность крупных централизованных решений. Дата-центрами можно управлять: одинаковое оборудование, одинаковые стойки, одинаковые сети, понятные зоны безопасности, SLA, мониторинг, биллинг. С точки зрения эксплуатации это привлекательно. Но политически, экономически и архитектурно это снова создает именно то, что всегда делало нас в сети уязвимыми: несколько центров силы.

Поэтому мысленный эксперимент начинается с простого встречного вопроса: что уже есть до того, как мы построим следующий дата-центр?

Насколько велика неиспользуемая емкость?

Идея на самом деле рождается в совершенно повседневный момент. Смартфон ночью лежит на тумбочке, подключен к питанию и почти ничего не делает. Но внутри него стоит чип, у которого больше специализированной ИИ-мощности, чем у многих компьютеров десять лет назад было во всем комплекте. iPhone 15 Pro с A17 Pro достигает примерно 35 триллионов операций Neural Engine в секунду. Даже если взять от этого только осторожное среднее значение, для устройства, которое большую часть ночи просто ждет, это абсурдно много.

То же самое происходит на рабочем столе. Новые ноутбуки имеют уже не только CPU и GPU, но и дополнительные NPU или Neural Engines. Apple уже много лет встраивает Neural Engine в свои чипы. Windows-ноутбуки выходят как AI-PC с выделенными ИИ-процессорами. Игровая консоль в гостиной имеет GPU-мощность, которая раньше звучала как рабочая станция. И все же мы обычно используем эту локальную вычислительную мощность только короткими всплесками: игра, экспорт, видеозвонок, локальный эффект, поиск. Потом устройство снова уходит в простой.

Именно здесь начинается мысленный эксперимент. Не: “Могу ли я завтра сдавать свой iPhone в аренду как дата-центр?” Это ерунда. А вот так: если столько кремния уже оплачено, подключено к сети и каждую ночь стоит на питании, насколько велика была бы теоретическая емкость, если использовать только маленькие, безопасные и подходящие временные окна?

Невозможно точно измерить всю неиспользуемую вычислительную мощность мира. Слишком разные устройства, слишком много офлайн-устройств, слишком многим нельзя участвовать из-за батареи, тепла, безопасности или платформенных ограничений. И все же грубая экстраполяция помогает почувствовать порядок величины.

Возьмем несколько намеренно простых блоков. Важно: я не считаю так, будто каждое устройство всегда полностью доступно. Я считаю с временными окнами, долями участия и осторожными скидками. Это остается мысленным экспериментом, но экспериментом с числами под ногами.

Tesla: кремний на колесах

Tesla сообщила в июне 2025 года о восьмимиллионном произведенном автомобиле. Не каждый из них еще активен, не у каждого одинаковое Autopilot-оборудование, и не каждый владелец разрешил бы своему автомобилю участвовать в вычислительной сети. Поэтому я считаю консервативно:

Из 8 миллионов произведенных автомобилей, возможно, 80 процентов еще реалистично активны и технически релевантны. Это было бы 6,4 миллиона автомобилей.
Для Hardware 3, то есть FSD Computer с 2019 года, часто называют порядок 144 TOPS для системы.
Hardware 4 стоит в более новых автомобилях и современнее, но Tesla не публикует для него чистое и простое TOPS-значение, как для более старых цифр Autonomy Day. Поэтому для этого расчета я все равно беру 144 TOPS как консервативное базовое значение.
Автомобиль часто стоит 23 часа в сутки, но по-настоящему интересно окно зарядки. Если ночью он 6,5 часа подключен к питанию, это в среднем по 24 часам соответствует примерно 27 процентам доступности.

Если бы только 25 процентов этих активных владельцев Tesla зарегистрировались, это было бы 1,6 миллиона автомобилей и примерно 62 экза-операции в секунду как суточный эквивалент. При 50 процентах участия это было бы около 125 экза-операций в секунду. Если бы теоретически участвовали все активные автомобили, число было бы около 250 экза-операций в секунду. В самом ночном окне мгновенная мощность была бы выше; число суточного эквивалента просто честнее для сравнения с дата-центром, который работает 24 часа.

iPhone: более крупный сюрприз

С iPhone расчет одновременно проще и сложнее. Проще, потому что Apple каждый год поставляет огромные объемы. Сложнее, потому что Apple не дает чистой публичной таблицы, какие поколения iPhone по всему миру еще активны. Поэтому я беру опубликованные данные о поставках последних лет и накладываю на них правдоподобную активную остаточную долю.

Год	поставленные iPhone	примерный чиповый микс	предполагаемая активная доля	средняя мощность Neural Engine
2021	235,7 млн	A14/A15	55 %	12 TOPS
2022	226,4 млн	A15/A16	65 %	16 TOPS
2023	234,6 млн	A16/A17 Pro	75 %	22 TOPS
2024	233,1 млн	A16/A17/A18	85 %	30 TOPS
2025	247,8 млн	A18/A19	95 %	32 TOPS

Эта смешанная оценка дает примерно 885 миллионов вероятно еще активных iPhone только из пяти лет поставок. Это не вся база iPhone, а намеренно ограниченный срез. Более старые поколения A14/A15 находились в нижнем двузначном диапазоне TOPS, A16 - чуть ниже 17 TOPS, A17 Pro - около 35 TOPS. Поэтому среднее значение по каждому году разумнее, чем делать вид, будто у всех устройств один и тот же чип.

Теперь снова та же игра: 6,5 часа ночью на питании, не весь день. Если бы 25 процентов этих устройств участвовали, получилось бы около 1'437 экза-операций в секунду как суточный эквивалент. При 50 процентах участия было бы около 2'875 экза-операций в секунду. Если бы теоретически участвовали все устройства, число было бы примерно 5'750 экза-операций в секунду.

Звучит безумно. Но именно в этом суть. Не потому, что iPhone является сервером. А потому, что масса устройств настолько велика, что даже осторожные доли внезапно выходят на порядок величины, который обычно ожидают только от дата-центров.

Сравнение

В качестве дополнительных ориентиров я беру:

50 миллионов настольных GPU, рабочих станций или небольших серверов, которые в среднем могли бы давать 20 TFLOPS FP32. Если из этого практически пригодными были бы только 20 процентов, осталось бы около 200 экза-операций в секунду в подходящих временных окнах.
xAI Colossus как сравнение из мира дата-центров. При 200'000 Hopper-GPU и примерно 3'958 INT8-TOPS на порядок H100 получается около 792 экза-операций в секунду теоретической пиковой ИИ-мощности. Это пик с учетом sparsity; плотная и постоянно пригодная мощность ниже.

Теоретический кремний в сравнении

Грубые экза-операции в секунду, усредненные на 24 часа. Tesla и iPhone рассчитаны с ночным окном 6,5 часа; для Tesla и iPhone график показывает теоретические доли участия, а не доступную сегодня емкость.

Tesla 50 % теоретически

125

PC / рабочие станции

200

xAI Colossus

792

iPhone 25 % теоретически

1'437

iPhone 50 % теоретически

2'875

Важно: это не бенчмарк. FP32-FLOPS, INT8-TOPS и Neural-Engine-TOPS не взаимозаменяемы 1:1. Память, interconnect, ПО, верификация, энергоэффективность, платформенные права и реальная загрузка решают, станет ли пиковая мощность полезной работой.

Это не точная глобальная емкость. Это мыслительная модель. И именно здесь нужно притормозить: TOPS нельзя просто налить в общий бассейн, как литры воды. Neural-Engine-TOPS у iPhone, INT8-TOPS у GPU и FP32-мощность рабочей станции - это разные вещи. Многим осмысленным задачам нужны не только вычислительные операции, но и RAM, VRAM, пропускная способность памяти, стабильное время работы, доступ к ПО и операционная система, которая вообще разрешает такие задачи.

И все же расчет показывает, почему идея не смешна. Уже консервативная комбинация PC, автомобилей и смартфонов как теоретический кремний выходит на порядок величины, который рядом с одним из самых заметных ИИ-дата-центров мира уже не выглядит абсурдно маленьким.

Особенно интересна цифра iPhone, потому что она рассматривает только пять лет поставок, а не всю активную установленную базу. Одновременно это лучший пример того, почему пиковой мощности недостаточно: iPhone не сервер. У него есть тепловые ограничения, логика батареи, правила операционной системы, модели защиты данных и владелец, который утром ожидает работающее устройство. И все же там лежит вычислительная мощность, которая всего несколько лет назад казалась бы science fiction.

И даже эти пиковые значения остаются только пиковыми значениями. Смартфон, безвентиляторный ноутбук или автомобильный контроллер не может просто отдавать такую мощность шесть часов подряд, как GPU в дата-центре. Тепло, троттлинг и защитная логика сильно снижают устойчивую производительность. Тот, кто хотел бы построить из этого настоящую сеть, должен считать именно устойчивую производительность, а не самую красивую цифру из спецификации.

Можно думать об этом и через электричество. Если 50 миллионов устройств в среднем вносили бы 150 ватт по четыре часа в день, это было бы около 11 TWh в год. Это лишь маленькая доля сегодняшнего глобального потребления дата-центров. Но этого было бы достаточно, чтобы поддерживать многие фоновые задачи, embeddings, научные рабочие нагрузки, рендеринг, задачи верификации или децентрализованные процессы хранения.

Неудобное возражение звучит так: это не обязательно автоматически будет эффективнее. У дата-центров лучше охлаждение, лучше загрузка, более дешевое электричество, более новое оборудование и профессиональная пакетная обработка. Домашнее устройство может быть хуже на единицу полезной вычислительной работы, особенно если возникает много накладных расходов или если батарея смартфона стареет быстрее ради нескольких центов кредитов. Децентрализованный compute grid поэтому не станет хорошим уже потому, что он распределенный. Для подходящих рабочих нагрузок он должен быть оправдан: технически, энергетически и экономически.

Еще интереснее становится с новыми AI-PC. Canalys ожидала, что в 2025 году будет поставлено около 100 миллионов AI-PC. Многие из этих устройств приносят NPU с 40 TOPS или больше. TOPS не то же самое, что GPU-FLOPS, и NPU не заменяет дата-центр. Но даже если смотреть на эту мощность очень осторожно, возникает новый класс локального ИИ-оборудования, который существует не только на бумаге, а попадает в офисы и квартиры.

Итак, смысл не в том: “Завтра мы заменим все дата-центры gaming-PC, Tesla и iPhone”. Смысл в другом: мы строим огромную новую централизованную емкость, пока одновременно гигантское количество распределенной, уже оплаченной емкости простаивает и исчезает.

Вычислительная мощность портится

Электричество я могу хранить. Не идеально, не без потерь, но в принципе. Если моя солнечная установка днем производит больше, чем мне нужно, энергия уходит в батарею или в сеть. Вечером я могу снова ее использовать, или ее использует мой сосед. Умные сети, батарейные хранилища и peer-to-peer-модели энергии делают этот способ мышления все более конкретным: иногда я производитель, иногда потребитель, и граница между клиентом и поставщиком становится мягче.

Вычислительная мощность работает иначе.

Неиспользованный GPU-час вчерашнего дня я сегодня не могу достать из ящика. Процессор, который всю ночь ничего не делал, не сохранил вычислительную мощность на потом. Это время ушло. Безвозвратно. Вычислительная мощность - скоропортящийся ресурс.

Именно это делает неиспользуемые устройства интересными. У нас есть не только оборудование. У нас есть постоянно исчезающие возможности. Краткосрочно реалистичный пул - это прежде всего настольные GPU, рабочие станции, игровые консоли, небольшие серверы, NAS-хранилища и ресурсы кампусов или провайдеров. Смартфоны и автомобили скорее долгосрочные пограничные случаи: технически они увлекательны, но из-за батареи, тепла, платформенных правил, безопасности и контроля производителей значительно сложнее.

Значит, проблема не только в математике, но и в стимуле. Устройства с самым интересным простаивающим кремнием как раз принадлежат закрытым платформам: Apple строит с Private Cloud Compute собственную инфраструктуру для крупных Apple-Intelligence-запросов, Tesla с Cortex строит собственную тренировочную емкость для FSD и Optimus. Зачем именно этим компаниям открывать свой парк устройств для независимого от производителя рынка вычислений, если контроль над оборудованием, ПО и облаком является настоящим защитным рвом?

И все же базовый вопрос остается: почему мы относимся к распределенной вычислительной мощности так, будто она нерелевантна, пока одновременно строим все более крупные центральные установки?

Может ли ИИ вообще считать децентрализованно?

Здесь нужно быть честным: для многого из того, что сегодня видно как ИИ, децентрализация сложна.

Большая языковая модель - это не просто список маленьких задач, которые можно произвольно бросить на чужие устройства. Моделям нужны RAM или VRAM. Им нужна пропускная способность памяти. Иногда им нужны быстрые interconnects. При генерации токенов модель снова и снова проходит через вычисления, и каждый дополнительный сетевой переход делает ответ медленнее. Разбивать frontier-модель на чужие смартфоны, старые ноутбуки и автомобили для интерактивного чат-ответа чаще всего было бы бессмысленно.

Но это не значит, что децентрализованный ИИ невозможен. Это значит только, что нужно выбирать правильные задачи.

Очень хорошо подходят работы, которые не должны завершаться за две секунды: embeddings для больших архивов, пакетные суммаризации, рендеринг, научные симуляции, синтетические данные, тесты, crawling, задачи верификации, децентрализованное восстановление хранилища, маленькие локальные модели, предварительная обработка и задачи, где результат можно проверить или посчитать несколько раз.

Практически задачи пришлось бы разделять намного чище:

Класс задачи	Децентрализованно разумно?	Почему
Частный локальный инференс	Да, но локально	Данные остаются на собственном устройстве или в собственной зоне доверия.
Batch inference и embeddings	Часто да	Высокая пропускная способность важнее секундной задержки.
Проверяемые частичные задачи	Да, если проверяемы	Результаты можно считать несколько раз, аттестовать или контролировать через тесты.
Хранение и репликация	Да, с правилами	Шифрование, erasure coding, аудиты и механизмы восстановления здесь уже известные строительные блоки.
Frontier training и жесткие SLA	Скорее нет	Слишком много связности, слишком много VRAM, слишком высокие требования к interconnect, эксплуатации и доступности.

Большие модели тоже не полностью исключены, но им нужна другая архитектура. Petals показал, что collaborative inference и fine-tuning больших моделей на распределенных ресурсах в принципе возможны. Prime Intellect с INTELLECT-2 идет еще на шаг дальше и показывает, как распределенное reinforcement learning с недоверенными worker-узлами может работать, если результаты верифицируются. Это еще не мир, где твой iPhone ночью тайно тренирует GPT-7. Но это намек на то, что проблема не является принципиально невозможной.

Реалистичный старт поэтому был бы не таким: “Мы распределяем огромную модель через все подряд”. Реалистичный старт был бы таким: сначала локальные модели, региональные пулы для подходящих пакетных задач, проверяемые задачи, ясные зоны данных и центральные дата-центры только там, где они действительно нужны.

Старая мечта распределенных систем

Есть другая история интернета. Та, которая меньше звучит как собор и больше как коллективная сеть.

Добровольные вычисления

SETI@home для меня всегда был одним из самых красивых примеров. Миллионы людей позволяли своим компьютерам в фоне считать данные радиоастрономии. Не потому, что за это они получали SaaS-дашборд, а потому что идея была достаточно большой: мы вместе ищем сигналы в шуме Вселенной. С марта 2020 года SETI@home больше не распределяет новые Work Units и находится в своего рода спящем режиме. Но как доказательство, что добровольные вычисления могут работать глобально, он остается важным.

BOINC, платформа за ним и рядом с ним, довольно трезво описывает, почему это работает: много независимых, вычислительно интенсивных задач, где пропускная способность важнее низкой задержки. Именно это является решающим отличием. Распределенная система не обязана выдавать каждый интерактивный чат-ответ за две секунды. Она может быть сильной там, где работа делима, проверяема и не нужна немедленно.

Хранилище без фиксированного места

IPFS переносит ту же мысль в область хранения. Файлы адресуются не прежде всего через место, а через свое содержимое. У содержимого есть fingerprint. Тот, у кого оно есть, может его отдать. Это другой способ мышления по сравнению с “этот файл лежит на этом сервере по этому URL”.

Деньги без центральной бухгалтерии

Bitcoin, совершенно независимо от того, как оценивать спекуляцию и энергопотребление, популяризировал похожую базовую идею: систему без центральной бухгалтерии, где консенсус не зависит от одного-единственного института. Не каждая децентрализованная идея автоматически хороша. Но Bitcoin показал, что протокол может быть политически мощным, если он убирает центральную точку контроля.

Хранение как сеть

В области хранения тоже были интересные попытки. Symform был децентрализованным cloud-storage-провайдером, где избыточное хранилище можно было внести в сеть. В 2014 году платформу приобрела Quantum; к тому моменту говорилось о 45'000 пользователях и малых компаниях в 170 странах. Storj, Sia, Filecoin и другие варианты тоже показывают: идея не новая. Она просто никак полностью не приходит в повседневность.

Сегодня эта идея продолжает жить в новых формах. Storj разбивает файлы на клиентской стороне на зашифрованные фрагменты и распределяет их по многим Storage Nodes. Это ближе к инфраструктуре, чем к романтике: пользователь в лучшем случае видит не распределенную сеть, а работающий сервис хранения.

Вычисления как рынок

Golem и Akash хотят сделать неиспользуемую вычислительную мощность доступной как рынок. Для меня это прямой мост к этой статье: распределенно лежит не только место хранения, но и процессоры, GPU и маленькие серверы, которые сегодня часто простаивают.

ИИ в распределенной сети

И Andrej Karpathy тоже снова появляется в этой среде: Prime Intellect называет его заметным сторонником, а Prime Intellect с INTELLECT-2 запустила децентрализованно распределенный RL-training run для модели с 32B параметрами, где могут участвовать гетерогенные permissionless-вычислительные ресурсы.

Это еще не идеальный ответ. Но это показывает: мечта не исчезла. Она просто снова и снова ищет форму, которая выживет в реальной эксплуатации.

Учиться у виртуальной электростанции

Интересно, что в области электричества такой способ мышления давно звучит менее экзотично.

Tesla описывает свою Virtual Power Plant как сеть распределенных энергетических источников: дома с солнечными установками и Powerwall рассматриваются вместе как электростанция. Когда сети нужна поддержка, батареи могут отдавать электричество. Владелец предоставляет ресурс и получает за это деньги или другие преимущества. Отдельные Powerwall малы. Вместе они могут стать релевантными для сети.

Именно эта аналогия меня и завораживает в вычислениях. Один GPU в домашнем офисе, один NAS, один iPhone или один автомобиль не является дата-центром. Но многие устройства вместе могли бы образовать новый слой: не для всего, не всегда, не без правил, но для определенных задач.

У аналогии есть пределы. Электричество намного более взаимозаменяемо, чем вычислительная работа. Киловатт-час не зависит от того, должна ли прямо сейчас выполняться модель с 80 GB VRAM, embedding pipeline или encrypted storage repair. Вычисления зависят от рабочей нагрузки. Именно поэтому нужны классы задач, планирование и жесткие исключения.

У Tesla ту же мысль видно даже в двух местах. Powerwall могут стать частью виртуальной электростанции. Автомобили в перспективе должны стать частью автономной robotaxi-флотилии, то есть зарабатывать деньги, когда владелец их сам не использует. Действительно ли и насколько быстро это масштабируется, другой вопрос. Но базовая идея важна: частное устройство уже не только потребляется, а может работать как инфраструктура в свободные временные окна.

Вычисления можно было бы мыслить похожим образом. Не как продажу электричества соседу, а как продажу проверяемого вычислительного времени, места хранения или модельной работы региональной ячейке. Пользователь в конце оплачивает электричество, тепло, износ оборудования и риск. Значит, он должен получать вознаграждение. Без этого пункта идея превращается лишь в красивый технический эксперимент.

Почему распределенная сеть так редко побеждает

Если децентрализация звучит так красиво, почему она не побеждает сама собой?

Потому что централизация часто является лучшим продуктовым пакетом.

Дата-центр контролируем. Распределенная сеть состоит из чужих устройств, разных операционных систем, меняющейся доступности, плохой предсказуемости и владельцев, которые выключают устройство, продают его, обновляют или отключают от сети. Для продакт-менеджера это не романтика, а головная боль.

К этому добавляется экономика. Многие децентрализованные проекты пытались решать стимулы через токены. Это понятно, потому что сеть без центральной компании все равно нуждается в оплате. Но как только расходы на хранение или вычислительное время привязаны к волатильной валюте, обычным компаниям становится неинтересно. Я не хочу, чтобы мой терабайт резервных копий внезапно стал дороже, потому что какую-то монету разогнали в Twitter. Я также не хочу, чтобы мой бюджет на GPU-часы зависел от рынка, который скорее ощущается как казино, чем как инфраструктура.

И ценовой соперник - не самая дорогая on-demand-GPU в облаке. Настоящее сравнение - это spot- и preemptible-предложения, то есть и так избыточная емкость дата-центров, которую провайдеры продают с большим дисконтом. Децентрализованная вычислительная сеть должна была бы быть не только философски красивее. Она должна была бы выдерживать конкуренцию с очень дешевой, хорошо интегрированной, пусть и прерываемой облачной емкостью.

Второй тормоз - удобство. S3 победил не потому, что он философски красив. Он победил потому, что он достаточно прост, достаточно документирован и везде интегрирован. Если децентрализованные сети хранения или вычислений хотят стать релевантными, для разработчиков и администраторов они должны ощущаться почти скучно: вставил API-key, создал bucket, настроил мониторинг, счет, SLA, restore-test, готово.

Потом идет безопасность. В корпоративной сети не должно внезапно происходить так, что какой-то чужой compute-job входящим соединением попадает на рабочие станции. Любой разумный firewall заблокировал бы это, а threat-intelligence-системы сочли бы подозрительным. Практически такая система должна скорее работать изнутри наружу: узел регистрируется в ячейке, забирает проверенные задачи, запускается в sandbox и видит только те данные, которые ему можно видеть. Иначе легитимная вычислительная сеть на сетевом уровне быстро будет выглядеть как очень вежливо сформулированный botnet.

Доверие - следующий жесткий пункт. Децентрализованные системы должны уметь доказывать, что работа выполнена корректно, не позволяя каждому узлу видеть все. В хранении есть известные строительные блоки: шифрование, erasure coding, аудиты, механизмы восстановления. С ИИ и вычислениями сложнее. Как проверить, что чужое устройство корректно выполнило модель? Как предотвратить утечку данных? Как защитить устройство участника от чужого кода?

Износ оборудования - это тоже больше, чем электричество. У SSD и NVMe есть лимиты записи. Тот, кто постоянно пишет веса модели, временные данные, embedding-batches или swap-файлы на потребительские устройства, расходует реальный срок службы. Добавляется проблема пропускной способности: если загрузка большой модели или набора данных занимает больше времени и создает больше сетевых накладных расходов, чем само вычисление, экономика ломается. Данные тяжелее, чем предполагает простая smart-grid-метафора.

Именно здесь INTELLECT-2 становится интересным. Prime Intellect в своей статье описывает TOPLOC как строительный блок, который верифицирует rollouts от недоверенных inference workers. Это не решает внезапно все compute-проблемы. Это не магическая защита любых корпоративных данных на чужом оборудовании. Но это показывает реальный механизм для определенного класса распределенной ИИ-работы: задачи строятся так, чтобы результаты были проверяемыми, вместо того чтобы слепо доверять каждому worker.

Для конфиденциальных данных одного этого недостаточно. Там потребовались бы другие строительные блоки: Confidential Computing, Trusted Execution Environments, Remote Attestation, чистые sandboxes, ясная классификация данных и, в сомнительных случаях, жесткое решение вообще не запускать определенные задачи на чужом оборудовании. К этому добавляются скучные, но решающие вопросы: налоги, ответственность, защита данных, data residency и условия интернет-провайдеров. Инфраструктура редко ломается только из-за математики. Часто она ломается из-за эксплуатации.

Compute smart grid

Я не представляю себе наивное “все P2P, и тогда все станет хорошо”. Инфраструктура так не работает. Что могло бы работать, так это compute smart grid с ясными слоями.

Первый слой называется: local first. Все личное, конфиденциальное или критичное к задержке должно по возможности работать на собственном устройстве или в собственной зоне доверия. Маленькие модели, локальный поиск, приватные summary, простая классификация, предварительная обработка, шифрование, embeddings для личных данных. Не каждое письмо, каждая заметка и каждый поиск должны уходить к hyperscaler.

Второй слой был бы региональным и федеративным. Город, район, кампус, компания, кооператив или провайдер мог бы управлять ячейкой. В этой ячейке устройства добровольно предоставляют ресурсы, но только при ясных условиях: только при подключении к питанию, только в простое, только в пределах тепловых ограничений, только с определенной максимальной мощностью, только для определенных классов задач.

Стартовой точкой были бы не смартфоны и автомобили, а более скучные устройства: настольные GPU, рабочие станции, игровые консоли, маленькие серверы, NAS-системы и свободная емкость у локальных провайдеров. Смартфоны позже могли бы брать маленькие задачи верификации. Автомобили были бы мыслимы еще позже, в очень узких, контролируемых производителем границах. Как и в электросети, сначала нужно начинать с ресурсов, которые надежны, измеримы и управляемы.

Третий слой остается центральным. Frontier training, жесткий real-time, экстремально большие модели, регуляторно чувствительные особые случаи и рабочие нагрузки с высокой связностью по-прежнему относятся к профессиональным дата-центрам. Децентрализация не обязана заменять все. Она должна только предотвратить ситуацию, когда каждая повседневная работа автоматически проходит через одни и те же пять центров силы.

Если бы это нужно было тестировать, я начал бы с малого. Не с миллионов iPhone, а с региональной ячейки из, возможно, 500-2'000 добровольных настольных GPU, рабочих станций, NAS-систем и маленьких серверов. Разрешены были бы только несколько типов задач: embeddings для несенситивных данных, научные batch-jobs, зашифрованные фрагменты хранения и задачи верификации. Успех измеряется не красивым exa-числом, а тремя скучными метриками: выполненные задачи на $1 расходов на электричество, error- и retry-rate, выплата с учетом износа оборудования.

Самая сложная часть - вознаграждение. Пользователь оплачивает электричество, тепло и износ оборудования. Значит, ему нужно что-то взамен. Вероятно, действительно потребовался бы токен или кредит. Но не как объект спекуляции, а как инфраструктурный кредит.

Такой compute-credit должен означать что-то реальное: GPU-minute определенного класса, GB-month storage, проверенный инференс, batch-embedding-unit или kWh-equivalent compute unit. Тот, кто дает ресурсы, зарабатывает кредиты. Тот, кому позже нужна ИИ-мощность, их тратит. Тот, кто ничего не хочет потреблять, мог бы вывести их в fiat, примерно как в виртуальной электростанции никто не хочет получать оплату в “Powerwall-coins”, а хочет настоящие деньги или понятный кредит.

Но от этого вопрос цены не решается магически. Стабильности нужен якорь: fiat-биллинг, коридоры цен на энергию, региональные клиринговые центры, кооперативные тарифы или регулируемые операторы. Совсем без управления “stable credits” быстро снова становятся свободно плавающим токеном. И тогда мы возвращаемся к старой проблеме: инфраструктура ощущается как казино.

Еще важнее вопрос прав эксплуатации. Нам не обязательно самим тренировать каждую крупную foundation model. Возможно, можно купить или лицензировать модели, открытые веса или семейства моделей, а затем эксплуатировать их децентрализованно, федеративно и под региональным контролем. Настоящий суверенитет тогда лежал бы не только в обучении, но и в эксплуатации: где работают модели? Где лежат данные? Кто имеет право на аудит? Есть ли обратный канал к провайдеру? Могу ли я продолжать запускать модель локально, если меняются политика, цены или условия?

Чтобы это было чем-то большим, чем красивый контракт на закупку, такие лицензии должны содержать настоящие права эксплуатации: локальные развертывания, долгосрочные обязательства по обновлениям и безопасности, понятные model cards, возможность аудита, ясные exit rights и отсутствие обязанности отправлять чувствительные данные обратно в центральное облако поставщика. Это была бы не чистая децентрализованная утопия. Но это был бы реалистичный путь между наивной самодостаточностью и полным platform lock-in.

Ночь, когда устройства считают

Представь, что сейчас 22:43. Твой настольный компьютер с GPU в простое, NAS онлайн, телефон заряжается. В настройках ты указал: максимум 80 ватт, только в простое, только для проверенных рабочих нагрузок из региона и только если вознаграждение покрывает расходы на электричество плюс резерв на износ оборудования.

Локальный агент сообщает свободную емкость. Не с твоим именем и не с твоими приватными данными, а как аттестованный узел с определенными возможностями. Ячейка распределяет маленькие задачи: симуляции, embeddings, зашифрованные фрагменты хранения, задачи верификации.

Утром там нет ракеты, Wall-Street-истории, hype-token. Только трезвая строка:

Этой ночью: заработано 2,4 GPU-credits, подтверждено 18 GB-months storage, расчетные расходы на электричество $0.31.

Позже ты используешь эти кредиты для локальной модели поверх собственных документов. Конфиденциальные данные остаются у тебя. Ты не только клиент. Ты участник.

Это звучит романтично. Да. Но иногда именно это причина серьезно отнестись к сложной инженерной проблеме.

Распределенная сеть и гора

Я не думаю, что центральные дата-центры исчезнут. Они слишком эффективны, слишком важны, а для некоторых задач просто необходимы. Гора останется. Вопрос только в том, построим ли мы рядом с ней снова основание.

Основание из локальных устройств, региональных ячеек, открытых протоколов, стабильных кредитов и ясных моделей безопасности. Основание, где вычислительная мощность не только продается сверху вниз, но и течет между участниками. Основание, где определенная ИИ-работа выполняется там, где ей место: приватная работа локально, региональная работа регионально, глобальные пограничные случаи в дата-центре.

Возможно, это наивно. Возможно, нет. Виртуальные электростанции тоже когда-то были странной идеей: тысячи маленьких батарей как одна большая сеть. Децентрализованные деньги долго звучали абсурдно. Автомобили, которые автономно работают как такси, звучали как science fiction. Не все из этого придет так, как было обещано. Но направление ясно: ресурсы, которые раньше пассивно стояли вокруг, все чаще мыслятся как часть более крупной системы.

И прямо сейчас везде стоят неиспользуемые машины. В квартирах, офисах, гаражах, серверных и карманах. Не каждая подходит одинаково хорошо. Не каждая вообще когда-либо должна выполнять чужую работу. Но многие уже здесь, оплачены и подключены к сети. И каждая неиспользованная секунда исчезает.

Может быть, нам стоит начать к ним прислушиваться.

До следующего раза,
Joe

Источники