
我们身边闲置的计算能力
目录
有时候,一个很大的基础设施问题,会从一个很小的画面开始:夜里,手机躺在充电器上。笔记本电脑合上了。游戏主机在客厅里待机。汽车停在车库里。到处都是已经付过钱、接着电、却大多数时候什么也没做的计算能力。
与此同时,新的数据中心正在兴建,规模像工业设施一样巨大。大厅里堆满 GPU、光纤、变压器、冷却系统和电力合同。我们正在建设一层新的数字基础设施,它将支撑我们的写作、搜索、编程、分析,甚至未来也许还会支撑决策。
如果其中一小部分能力不只是白白消失,会怎样?这不是幻想每部手机突然取代数据中心,而是一个严肃的思想实验:能不能出现一种 Compute Smart Grid,让设备自愿地、有限地、并且有偿地贡献算力?
在从 PRISM 到 Prompts这篇文章里,我写的是这场发展的另一面:我们越来越依赖少数 AI 平台,尤其是来自美国和中国的平台。而这里,我感兴趣的是相反的方向。不是天真的 P2P 浪漫,而是一个技术问题:已经分散在世界各处的算力到底有多少,哪些 AI 任务真的可以分布式执行,又需要什么机制,人才会因此得到公平报酬?
计算能力不能储存。一个没用掉的 GPU 小时不是备用资源。它只是消失了。
这个思想实验
AI 不只是软件。AI 是电力、冷却、光纤、GPU、土地、水和资本。International Energy Agency 估计,2024 年全球数据中心消耗了约 415 TWh 电力,约占全球用电量的 1.5%。到 2030 年,这个数字可能达到约 945 TWh。
这不只是可持续发展报告里的一个数字。这是基础设施政策。AI 服务 7x24 可用。每一次总结、每一个代码问题、每一张图片、每一次代理运行都是一次计算。当数十亿人和企业把工作放进 AI 循环里,它就变成了一种基础负载。
所以我理解大型集中式方案的吸引力。数据中心可控:相同硬件、相同机架、相同网络、清晰的安全区域、SLA、监控和计费。从运营角度看,这很有吸引力。但在政治、经济和架构层面,它又制造出那个一直让互联网脆弱的东西:少数权力中心。
因此,这个思想实验从一个简单反问开始:在建设下一个数据中心之前,我们手里已经有什么?
闲置容量到底有多大?
这个想法其实来自一个很日常的瞬间。夜里,手机放在床头柜上,接着电,几乎什么也不做。但它里面的芯片拥有的 AI 专用计算能力,已经超过许多十年前电脑作为整体系统所能提供的能力。搭载 A17 Pro 的 iPhone 15 Pro,其 Neural Engine 约可达到每秒 35 万亿次运算。即使只取一个谨慎的平均值,对于一台大半夜都在等待的设备来说,这也高得离谱。
桌面上也发生着同样的事。新的笔记本电脑不再只有 CPU 和 GPU,还额外配有 NPU 或 Neural Engine。Apple 多年来一直在自家芯片中加入 Neural Engine。Windows 笔记本也正在以 AI PC 的形式出现,内置专用 AI 处理器。客厅里的游戏主机拥有过去听起来像工作站的 GPU 性能。可是我们通常只在很短的峰值里使用这些本地算力:一局游戏、一次导出、一次视频通话、一个本地效果、一次搜索。之后设备又回到空闲状态。
正是在这里,思想实验开始了。问题不是:“我明天能把自己的 iPhone 当数据中心出租吗?”那是胡扯。真正的问题是:如果这么多硅片已经被购买、联网,并且每晚接通电源,那么只利用小的、安全的、合适的时间窗口,理论容量会有多大?
世界上的闲置算力无法精确测量。设备差异太大,许多设备离线,许多设备因为电池、散热、安全或平台规则根本不能参与。尽管如此,一个粗略估算可以帮助我们感受数量级。
为此,我们取几个刻意简化的区块。重要的是:我并不是假设每台设备随时都能满负荷可用。我会考虑时间窗口、参与率和谨慎折扣。它仍然是一个思想实验,但脚下有数字。
Tesla:车轮上的硅片
Tesla 在 2025 年 6 月报告了第 800 万辆量产车辆。并不是每一辆都还在使用,并不是每一辆都有相同的 Autopilot 硬件,也不是每位车主都会愿意把自己的车开放给计算网络。因此我保守计算:
- 800 万辆已生产车辆中,也许 80% 仍然现实地在使用,并且在技术上相关。也就是 640 万辆车。
- 对于 Hardware 3,也就是 2019 年起的 FSD Computer,系统层面常被提到的数量级是 144 TOPS。
- Hardware 4 装在更新的车辆里,也更现代,但 Tesla 没有像早期 Autonomy Day 那样发布干净、简单的 TOPS 数字。因此这次计算仍然用 144 TOPS 作为保守基准值。
- 一辆车虽然经常一天停放 23 小时,但真正有意思的是充电窗口。如果夜里 接电 6.5 小时,折算到 24 小时平均约为 27% 可用性。
如果只有 25% 的活跃 Tesla 车主加入,那就是 160 万辆车,按日均折算约为 62 Exa operations per second。50% 参与时约为 125 Exa operations per second。如果理论上所有活跃车辆都参与,数字大约是 250 Exa operations per second。夜间窗口本身的瞬时能力更高;日均折算只是为了和 24 小时运行的数据中心做更公平的比较。
iPhone:更大的惊喜
iPhone 的估算同时更简单也更困难。简单,是因为 Apple 每年出货量巨大。困难,是因为 Apple 没有提供一张清晰的公开表格,说明全球仍在使用的 iPhone 分别属于哪些世代。因此我取过去几年的公开出货量,再叠加一个合理的活跃保留率。
| 年份 | 出货 iPhone 数量 | 粗略芯片组合 | 假设活跃比例 | 平均 Neural Engine 性能 |
|---|---|---|---|---|
| 2021 | 235.7 百万部 | A14/A15 | 55 % | 12 TOPS |
| 2022 | 226.4 百万部 | A15/A16 | 65 % | 16 TOPS |
| 2023 | 234.6 百万部 | A16/A17 Pro | 75 % | 22 TOPS |
| 2024 | 233.1 百万部 | A16/A17/A18 | 85 % | 30 TOPS |
| 2025 | 247.8 百万部 | A18/A19 | 95 % | 32 TOPS |
这个混合估算仅从五个出货年份,就得到约 8.85 亿部可能仍在使用的 iPhone。这不是整个 iPhone 安装基数,而是有意限制的一个切片。较老的 A14/A15 世代处在十几 TOPS 的区间,A16 接近 17 TOPS,A17 Pro 约 35 TOPS。因此按年份取平均,比假装所有设备都搭载同一颗芯片更合理。
现在还是同一套玩法:夜里接电 6.5 小时,不是整天。如果这些设备中有 25% 参与,按日均折算约为 1'437 Exa operations per second。50% 参与时约为 2'875 Exa operations per second。如果理论上全部设备参与,数字约为 5'750 Exa operations per second。
这听起来疯狂。但重点正是这里。不是因为 iPhone 是服务器,而是因为设备数量太大,以至于即使采用谨慎比例,也会突然进入通常只会联想到数据中心的数量级。
对比
作为其他参照点,我取:
- 5000 万块桌面 GPU、工作站或小型服务器,平均可以提供 20 TFLOPS FP32。如果其中只有 20% 在实践中可用,在合适时间窗口里仍有约 200 Exa operations per second。
- 数据中心世界的比较对象 xAI Colossus。如果按 200'000 块 Hopper GPU 和每块 H100 数量级约 3'958 INT8-TOPS 计算,可以得到约 792 Exa operations per second 的理论 AI 峰值性能。这是 sparsity peak;密集且持续可用的性能会更低。
粗略的每秒 Exa operations,按 24 小时平均。Tesla 和 iPhone 按 6.5 小时夜间窗口计算;对 Tesla 和 iPhone,图中显示的是理论参与率,不是今天已经可调用的容量。
重要:这不是基准测试。FP32-FLOPS、INT8-TOPS 和 Neural Engine TOPS 不能 1:1 互换。内存、互连、软件、验证、能效、平台权限和真实利用率,决定了峰值性能能否变成可用工作。
这不是精确的全球容量,而是一个思维模型。也正是在这里必须刹车:TOPS 不能像几升水一样倒进一个共同水池。iPhone 的 Neural Engine TOPS、GPU 的 INT8 TOPS、工作站的 FP32 性能是不同的东西。许多有意义的任务不只需要计算操作,还需要 RAM、VRAM、内存带宽、稳定运行时间、软件访问,以及一个允许这类任务运行的操作系统。
尽管如此,这个估算说明这个想法并不荒唐。PC、车辆和智能手机的保守组合,作为理论硅片能力,也能达到一个数量级,在世界上最显眼的 AI 数据中心之一旁边,不再显得小到可笑。
iPhone 的数字尤其有趣,因为它只看五个出货年份,而不是整个活跃安装基数。同时它也是说明峰值性能不够的最佳例子:iPhone 不是服务器。它有散热限制、电池逻辑、操作系统规则、隐私模型,还有一个期待第二天早上设备能正常工作的主人。尽管如此,那里仍然有几年前像科幻一样的计算能力。
而且这些峰值也只是峰值。智能手机、无风扇笔记本或汽车控制单元,不能像数据中心 GPU 那样连续六小时输出这种性能。散热、降频和保护逻辑会大幅压低持续性能。任何想把它变成真实网络的人,都必须按持续性能计算,而不是按数据表里最漂亮的数字计算。
也可以从电力角度来想。如果 5000 万台设备平均每天贡献 150 watt、持续 4 小时,那每年约为 11 TWh。这只是当今全球数据中心耗电量的一小部分。但已经足以承担许多后台任务、Embedding、科学工作负载、渲染、验证任务或去中心化存储流程。
令人不舒服的反驳是:这并不自动更高效。数据中心有更好的冷却、更高的利用率、更便宜的电力、更新的硬件和专业的批处理。家用设备每单位有用计算可能更差,尤其是在开销很多,或者智能手机电池为了几分钱 Credits 更快老化时。因此,一个去中心化 Compute Grid 并不会因为分布式就天然更好。它必须对合适的工作负载在净效益上有意义:技术上、能源上、经济上都要如此。
新的 AI PC 让事情更有意思。Canalys 曾预计 2025 年将出货约 1 亿台 AI PC。许多设备配有 40 TOPS 或更高的 NPU。TOPS 不是 GPU-FLOPS,NPU 也不能替代数据中心。但即使非常谨慎地看,也正在出现一类新的本地 AI 硬件,它不只存在于纸面上,而是进入办公室和家庭。
所以重点不是:“我们明天用游戏 PC、Tesla 和 iPhone 替代所有数据中心。”重点是:我们正在建设巨大的新集中式容量,同时,一大批分布式、已经付过钱的容量却闲置并消失。
计算能力会过期
电力可以储存。不是完美地,不是无损地,但原则上可以。如果我的太阳能系统中午生产的电力超过需要,能量会进入电池或电网。晚上我可以再次使用,或者邻居可以使用。Smart Grid、电池储能和点对点能源模型让这种思考越来越具体:有时我生产,有时我消费,客户和供应者之间的边界变得更柔软。
计算能力不一样。
昨天没用掉的 GPU 小时,今天不能从抽屉里拿出来。一个处理器一整夜什么也没做,并不会为以后保留计算能力。那段时间没了。不可挽回。Compute 是会过期的。
这正是闲置设备令人感兴趣的地方。我们拥有的不只是硬件。我们拥有的是持续消失的机会。短期现实的资源池主要是桌面 GPU、工作站、游戏主机、小型服务器、NAS 存储,以及校园或本地服务商的资源。智能手机和汽车更像长期边缘案例:技术上很迷人,但由于电池、散热、平台规则、安全和厂商控制,难度明显更高。
因此,障碍不只在数学,也在激励。最有趣的闲置硅片恰好属于封闭平台:Apple 用 Private Cloud Compute 为大型 Apple Intelligence 请求建设自己的基础设施,Tesla 用 Cortex 为 FSD 和 Optimus 建设自己的训练容量。如果硬件、软件和云的控制权才是真正的护城河,这些公司为什么要把自己的设备车队开放给独立于厂商的计算市场?
尽管如此,根本问题仍然存在:当我们同时建设越来越大的集中式设施时,为什么把分布式计算能力当成无关紧要?
AI 真的能分布式计算吗?
这里必须诚实:今天可见的许多 AI,对去中心化来说很难。
一个大型语言模型不是一串可以随意扔给陌生设备的小任务。模型需要 RAM 或 VRAM,需要内存带宽,有时还需要高速互连。Token 生成会一遍又一遍运行模型,每增加一次网络跳转都会让响应变慢。为了交互式聊天回答,把一个 Frontier Model 拆到陌生智能手机、旧笔记本和汽车上,通常是没有意义的。
但这并不意味着去中心化 AI 不可能。它只意味着必须选择正确的任务。
不需要两秒内完成的工作非常适合:大型档案的 Embedding、批量摘要、渲染、科学模拟、合成数据、测试、抓取、验证任务、去中心化存储修复、小型本地模型、预处理,以及可以检查结果或重复计算的任务。
实践中,任务必须分得更干净:
| 任务类型 | 去中心化是否合理? | 原因 |
|---|---|---|
| 私有本地推理 | 是,但应保持本地 | 数据留在自己的设备或自己的信任空间里。 |
| 批量推理和 Embedding | 通常是 | 高吞吐量比秒级延迟更重要。 |
| 可验证子任务 | 如果可检查,就是 | 结果可以重复计算、证明或通过测试验证。 |
| 存储和复制 | 有规则时是 | 加密、Erasure Coding、审计和修复机制是这里已知的组件。 |
| Frontier Training 和硬 SLA | 更倾向于不是 | 耦合太强,VRAM 太多,对互连、运营和可用性的要求太高。 |
大型模型并非完全排除,但需要不同架构。Petals 已经展示,在分布式资源上对大型模型进行协作推理和微调原则上可行。Prime Intellect 通过 INTELLECT-2 又进一步展示,如果结果可以验证,使用不可信 Worker 的分布式 Reinforcement Learning 如何工作。这还不是你的 iPhone 夜里偷偷训练 GPT-7 的世界。但它说明问题并非根本不可能。
因此,现实起点不是:“把一个巨大模型横跨一切分布出去。”现实起点是:本地模型优先,为合适的批量任务建立区域资源池,可验证任务,清晰的数据区域,并且只有真正必要时才使用集中式数据中心。
分布式系统的旧梦
互联网还有另一种叙事。它听起来不像大教堂,更像蜂群。
志愿计算
SETI@home 对我来说一直是最美的例子之一。数百万人让自己的电脑在后台计算射电天文学数据。不是因为他们得到了一个 SaaS 仪表板,而是因为那个想法足够大:我们一起在宇宙的噪声中寻找信号。自 2020 年 3 月以来,SETI@home 不再分发新的 Work Units,进入了一种休眠状态。但作为志愿计算可以在全球规模运行的证明,它仍然重要。
BOINC,也就是其背后和旁边的平台,冷静地解释了为什么这能工作:许多独立、计算密集型的任务,其中吞吐量比低延迟更重要。这正是关键区别。分布式系统不需要把每个交互式聊天回答都在两秒内交付。它可以在工作可拆分、可验证、不需要立刻完成的地方变强。
没有固定位置的存储
IPFS 把同样的思想带入存储领域。文件主要不是通过某个位置寻址,而是通过内容寻址。内容有指纹。谁拥有它,谁就能提供它。这和“这个文件在这个服务器的这个 URL 下”是另一种思维方式。
没有中央记账的货币
Bitcoin 不管人们如何评价投机和能耗,都普及了一种类似的原始想法:没有中央记账的系统,共识不依赖单一机构。不是每个去中心化想法都自动好。但 Bitcoin 展示了,当协议移除中央控制点时,它可以具有政治力量。
作为网络的存储
存储方面也有过有趣尝试。Symform 是一个去中心化云存储提供商,可以把多余存储贡献到网络里。2014 年该平台被 Quantum 收购;当时提到 170 个国家里的 45'000 名用户和小型企业。Storj、Sia、Filecoin 以及其他变体也说明:这个想法并不新。只是它从未完全进入日常。
今天,这个想法以新形式继续存在。Storj 在客户端加密文件,把它们拆成片段并分发到许多 Storage Nodes。它更接近基础设施,而不是浪漫:用户最好看不见蜂群,只看见一个能工作的存储服务。
作为市场的 Compute
Golem 和 Akash 想把闲置计算能力变成可访问的市场。对我来说,这是通往本文的直接桥梁:分散在各处的不只是存储空间,还有处理器、GPU 和小型服务器,它们今天常常处于空闲。
分布式蜂群里的 AI
Andrej Karpathy 也在这个环境里再次出现:Prime Intellect 把他列为知名支持者,而 Prime Intellect 通过 INTELLECT-2 启动了一轮针对 32B 参数模型的去中心化分布式 RL 训练,异构、无需许可的计算资源可以参与。
这还不是完美答案。但它说明:这个梦想没有消失。它只是一次又一次寻找能在真实运营中存活的形式。
向虚拟电厂学习
有意思的是,在电力领域,这种思路早已不那么奇特。
Tesla 把自己的 Virtual Power Plant 描述为分布式能源的网络:拥有太阳能系统和 Powerwall 的家庭被合起来看作一个电厂。当电网需要支持时,电池可以释放电力。屋主提供资源,并因此得到金钱或其他好处。单个 Powerwall 很小。但合在一起,它们可以对电网变得重要。
这正是 Compute 里让我着迷的类比。家庭办公室里的一块 GPU、一个 NAS、一部 iPhone 或一辆车不是数据中心。但许多设备合在一起,可能形成一层新的东西:不是为了一切,不是随时,不是没有规则,而是为特定任务服务。
这个类比有边界。电力比计算工作更可替代。一千瓦时不会取决于它现在要运行 80 GB VRAM 的模型、Embedding Pipeline,还是加密的存储修复。Compute 与工作负载有关。因此需要任务类型、调度和明确排除项。
在 Tesla 那里,同一个想法甚至出现在两处。Powerwall 可以成为虚拟电厂的一部分。汽车未来则被设想为自动驾驶 Robotaxi 车队的一部分,也就是在车主自己不用时赚钱。它是否以及多快真正扩大规模,是另一个问题。但基本想法很重要:私人设备不再只是被消费,而可以在空闲时间窗口里作为基础设施工作。
Compute 也可以这样想。不是把电卖给邻居,而是把可验证的计算时间、存储空间或模型工作卖给一个区域单元。用户最终承担电力、热量、硬件磨损和风险。因此也必须获得报酬。没有这一点,这个想法只是漂亮的技术实验。
为什么蜂群很少获胜
如果去中心化听起来这么美,为什么它没有轻易胜出?
因为集中化往往是更好的产品组合。
数据中心是可控的。蜂群由陌生设备、不同操作系统、变化的可用性、较差的可预测性,以及可能关闭、出售、更新或断开设备的拥有者组成。对产品经理来说,这不是浪漫,而是头痛。
然后是经济性。许多去中心化项目试图用 Token 解决激励。这可以理解,因为没有中心公司的网络仍然需要报酬。但一旦存储或计算时间的成本绑定到波动货币,对普通企业来说就不再有吸引力。我不希望自己的 1 TB 备份突然变贵,只因为某个 Coin 在 Twitter 上被炒作。我也不希望 GPU 小时预算依赖一个感觉更像赌场而不是基础设施的市场。
而且价格对手不是云里最贵的按需 GPU。真正的比较对象是 Spot 和 Preemptible 产品,也就是提供商以显著折扣出售的、原本就多余的数据中心容量。因此去中心化计算网络不能只是哲学上更漂亮。它必须能对抗非常便宜、集成良好、尽管可中断的云容量。
第二个阻力是便利性。S3 不是因为哲学上漂亮而获胜。它赢是因为足够简单、文档足够好,并且到处都已集成。如果去中心化存储或计算网络想变得相关,它们对开发者和管理员来说必须几乎无聊:放入 API key,创建 Bucket,监控,账单,SLA,恢复测试,完成。
接着是安全。在企业网络里,不应该突然有某个外部计算任务以入站方式落到工作站上。任何合理的防火墙都会阻止它,威胁情报系统也会觉得可疑。实际中,这类系统更应该从内向外工作:节点向某个单元报到,取回已检查的任务,在沙箱中运行,只看到它被允许看到的数据。否则,一个合法计算网络在网络层上很快会看起来像一个措辞非常礼貌的 Botnet。
信任是下一个硬点。去中心化系统必须能证明工作已被正确完成,而不让每个节点看到一切。存储里有已知组件:加密、Erasure Coding、审计、修复机制。AI 和 Compute 会更难。我如何检查一个陌生设备是否正确执行了模型?如何防止数据外泄?如何保护参与者的设备免受外部代码影响?
硬件磨损也不只是电。SSD 和 NVMe 存储有写入寿命。如果模型权重、临时数据、Embedding 批次或 Swap 文件不断写入消费级设备,就会消耗真实寿命。还有带宽问题:如果下载大型模型或数据集所需时间和网络开销超过实际计算,账就算不通。数据比简单的 Smart Grid 类比暗示的更重。
也正是在这里,INTELLECT-2 变得有趣。Prime Intellect 在论文中把 TOPLOC 描述为一个组件,用来验证不可信推理 Worker 的 Rollout。它并不会突然解决所有 Compute 问题。它也不是把任意企业数据放在外部硬件上的魔法隐私方案。但它为某一类分布式 AI 工作展示了真实机制:任务被构造成结果可验证,而不是盲目信任每个 Worker。
对于机密数据,单靠这个不够。那里需要其他组件:Confidential Computing、Trusted Execution Environments、Remote Attestation、干净的沙箱、清晰的数据分类,以及在必要时做出硬决定,让某些任务根本不要跑在外部硬件上。还要加上一些无聊但决定性的题目:税务、责任、隐私、数据驻留,以及互联网服务商的条款。基础设施很少只因为数学失败。它通常失败在运营。
一个 Compute Smart Grid
我想象的不是天真的“所有东西都是 P2P,然后一切都会变好”。基础设施不是这样运作的。可能可行的是一个有清晰层次的 Compute Smart Grid。
第一层叫本地优先。凡是个人、机密或延迟敏感的东西,都应该尽可能运行在自己的设备或自己的信任空间里。小模型、本地搜索、私有摘要、简单分类、预处理、加密、个人数据的 Embedding。不是每封邮件、每条笔记、每次搜索都必须去 Hyperscaler。
第二层是区域化和联邦化。一个城市、街区、校园、企业、合作社或服务商可以运行一个单元。在这个单元里,设备自愿提供资源,但必须在清晰条件下:只在接电时,只在空闲时,只在散热边界内,只以定义好的最大功率运行,只用于特定任务类型。
起点不是智能手机和汽车,而是更无聊的设备:桌面 GPU、工作站、游戏主机、小型服务器、NAS 系统以及本地服务商的空闲容量。智能手机以后可以承担小型验证任务。汽车更晚才可能,而且只能在非常狭窄、由厂商控制的边界内。就像电网一样,必须先从可靠、可测量、可控制的资源开始。
第三层仍然是集中式。Frontier Training、严格实时、极大模型、监管敏感的特殊案例以及高度耦合的工作负载,仍然属于专业数据中心。去中心化不需要取代一切。它只需要阻止每一项日常工作都自动流经同样五个权力中心。
如果要测试,我会从小处开始。不是数百万部 iPhone,而是一个由 500 到 2'000 个志愿桌面 GPU、工作站、NAS 系统和小型服务器组成的区域单元。允许的任务类型只有少数几种:非敏感数据的 Embedding、科学批处理任务、加密存储片段和验证任务。成功不看漂亮的 Exa 数字,而看三个无聊指标:每 $1 电力成本完成的任务数,错误和重复率,扣除硬件磨损后的报酬。
最难的是报酬。用户承担电力、热量和硬件磨损。因此他需要得到回报。也许确实需要 Token 或 Credit。但不是作为投机对象,而是作为基础设施余额。
这样的 Compute Credit 必须代表某种真实东西:某一类别的 GPU 分钟、一个 GB-month 存储、一次已验证推理、一个批量 Embedding 单元,或一个 kWh-equivalent 计算单元。提供资源的人赚取 Credits。后来自己需要 AI 能力时,就消耗它们。不想消耗的人可以兑换成法定货币,就像在虚拟电厂里,人们不想拿“Powerwall Coins”,而是想拿真钱或清晰的账面抵扣。
但这并不会神奇地解决定价问题。稳定性需要锚:法币结算、能源价格区间、区域清算机构、合作社费率或受监管运营商。没有治理,“稳定 Credits”很快又会变成自由波动的 Token。然后旧问题回来:基础设施感觉像赌场。
更重要的是运营权。我们不必自己训练每一个大型 Foundation Model。也许可以购买或授权模型、开放权重或模型家族,然后以去中心化、联邦化、区域可控的方式运行它们。真正的主权不仅在训练,也在运营:模型在哪里运行?数据在哪里?谁可以审计?有没有回到提供商的回传通道?当政治、价格或条款改变时,我能否继续在本地运行模型?
为了让这不只是漂亮的采购合同,这类授权必须包含真正的运营权:本地部署、长期更新和安全承诺、可追溯的模型卡、可审计性、明确退出权,并且不能强制把敏感数据重新推回中央厂商云。这不是纯粹的去中心化乌托邦。但它是在天真自给自足和彻底平台锁定之间的一条现实路径。
设备计算的那个夜晚
想象一下,现在是 22:43。你带 GPU 的桌面电脑处于空闲状态,NAS 在线,手机在充电。你在设置里规定:最多 80 watt,只在空闲时,只接收本区域已检查的工作负载,并且只有当报酬覆盖电费加硬件折旧时才运行。
一个本地代理报告空闲容量。不是用你的名字,也不是用你的私人数据,而是作为一个具有特定能力、已被证明的节点。区域单元分发小任务:模拟、Embedding、加密存储片段、验证任务。
早晨,没有火箭,没有 Wall Street 故事,没有炒作 Token。只有一行冷静的文字:
今夜:赚取 2.4 GPU Credits,确认 18 GB-months 存储,估计 $0.31 电费。
之后,你把这些 Credits 用在自己文档上的本地模型。敏感数据留在你这里。你不只是客户。你也是参与者。
这听起来很浪漫。是的。但有时候,正是这种感觉,才是认真对待一个困难工程问题的理由。
蜂群与高山
我不认为集中式数据中心会消失。它们太高效、太重要,而且对某些任务来说就是必要的。高山会留下。问题只是,我们是否在旁边重新铺一层地面。
一层由本地设备、区域单元、开放协议、稳定 Credits 和清晰安全模型构成的地面。在那里,算力不只是自上而下被出售,而是在参与者之间流动。在那里,某些 AI 工作运行在它本该运行的地方:私人工作在本地,区域工作在区域内,全球边缘案例在数据中心里。
也许这很天真。也许不是。虚拟电厂曾经也是一个奇怪想法:成千上万块小电池组成一个大网络。去中心化货币长期听起来很荒唐。汽车自主当出租车运行,也曾像科幻。不是所有承诺都会按原样到来。但方向很清楚:过去被动闲置的资源,越来越被当作更大系统的一部分来思考。
此刻,到处都有闲置机器。公寓、办公室、车库、服务器机房和口袋里。不是每一台都同样适合。不是每一台都应该执行外部工作。但很多已经在那里,已经付过钱,并且已经联网。而每一个未使用的秒都会消失。
也许我们应该开始倾听它们。
下次见,
Joe
来源
- IEA: Energy and AI, Executive Summary
- NVIDIA H100 Tensor Core GPU
- NVIDIA Developer: Confidential Computing on H100 GPUs
- AWS: Amazon EC2 Spot Instances
- Ars Technica: Tesla’s autonomy event and FSD computer
- Tesla Q2 2025 Update: 8-millionth vehicle
- Tesla Support: Virtual Power Plant
- Android Central: IDC 2021 smartphone shipments
- TASS: IDC 2022 smartphone shipments
- Gizmochina: IDC 2023 smartphone shipments
- IDC: Worldwide smartphone shipments 2025
- Tom’s Hardware: A15 Bionic Neural Engine
- Apple: A16 Bionic Neural Engine
- Notebookcheck: Apple A17 Pro NPU specs
- Tom’s Hardware: xAI Colossus reaches 200,000 GPUs
- Canalys: AI-capable PC shipments
- Apple Security Research: Private Cloud Compute
- TechCrunch: Tesla Dojo, Cortex and AI training compute
- IPFS: Building blocks for a better web
- Bitcoin whitepaper
- SETI@home hibernation announcement
- BOINC overview
- Quantum: Acquisition of Symform’s cloud services platform
- Storj Docs: Introduction to Storj
- Golem Network
- Akash Network: What is Akash?
- arXiv: Petals, collaborative inference and fine-tuning
- Prime Intellect: INTELLECT-2
- arXiv: INTELLECT-2 technical paper


