我们身边闲置的计算能力

2026年6月3日 • 5 min read

与此同时，新的数据中心正在兴建，规模像工业设施一样巨大。大厅里堆满 GPU、光纤、变压器、冷却系统和电力合同。我们正在建设一层新的数字基础设施，它将支撑我们的写作、搜索、编程、分析，甚至未来也许还会支撑决策。

如果其中一小部分能力不只是白白消失，会怎样？这不是幻想每部手机突然取代数据中心，而是一个严肃的思想实验：能不能出现一种 Compute Smart Grid，让设备自愿地、有限地、并且有偿地贡献算力？

在从 PRISM 到 Prompts这篇文章里，我写的是这场发展的另一面：我们越来越依赖少数 AI 平台，尤其是来自美国和中国的平台。而这里，我感兴趣的是相反的方向。不是天真的 P2P 浪漫，而是一个技术问题：已经分散在世界各处的算力到底有多少，哪些 AI 任务真的可以分布式执行，又需要什么机制，人才会因此得到公平报酬？

计算能力不能储存。一个没用掉的 GPU 小时不是备用资源。它只是消失了。

这个思想实验

AI 不只是软件。AI 是电力、冷却、光纤、GPU、土地、水和资本。International Energy Agency 估计，2024 年全球数据中心消耗了约 415 TWh 电力，约占全球用电量的 1.5%。到 2030 年，这个数字可能达到约 945 TWh。

这不只是可持续发展报告里的一个数字。这是基础设施政策。AI 服务 7x24 可用。每一次总结、每一个代码问题、每一张图片、每一次代理运行都是一次计算。当数十亿人和企业把工作放进 AI 循环里，它就变成了一种基础负载。

所以我理解大型集中式方案的吸引力。数据中心可控：相同硬件、相同机架、相同网络、清晰的安全区域、SLA、监控和计费。从运营角度看，这很有吸引力。但在政治、经济和架构层面，它又制造出那个一直让互联网脆弱的东西：少数权力中心。

因此，这个思想实验从一个简单反问开始：在建设下一个数据中心之前，我们手里已经有什么？

闲置容量到底有多大？

这个想法其实来自一个很日常的瞬间。夜里，手机放在床头柜上，接着电，几乎什么也不做。但它里面的芯片拥有的 AI 专用计算能力，已经超过许多十年前电脑作为整体系统所能提供的能力。搭载 A17 Pro 的 iPhone 15 Pro，其 Neural Engine 约可达到每秒 35 万亿次运算。即使只取一个谨慎的平均值，对于一台大半夜都在等待的设备来说，这也高得离谱。

桌面上也发生着同样的事。新的笔记本电脑不再只有 CPU 和 GPU，还额外配有 NPU 或 Neural Engine。Apple 多年来一直在自家芯片中加入 Neural Engine。Windows 笔记本也正在以 AI PC 的形式出现，内置专用 AI 处理器。客厅里的游戏主机拥有过去听起来像工作站的 GPU 性能。可是我们通常只在很短的峰值里使用这些本地算力：一局游戏、一次导出、一次视频通话、一个本地效果、一次搜索。之后设备又回到空闲状态。

正是在这里，思想实验开始了。问题不是：“我明天能把自己的 iPhone 当数据中心出租吗？”那是胡扯。真正的问题是：如果这么多硅片已经被购买、联网，并且每晚接通电源，那么只利用小的、安全的、合适的时间窗口，理论容量会有多大？

世界上的闲置算力无法精确测量。设备差异太大，许多设备离线，许多设备因为电池、散热、安全或平台规则根本不能参与。尽管如此，一个粗略估算可以帮助我们感受数量级。

为此，我们取几个刻意简化的区块。重要的是：我并不是假设每台设备随时都能满负荷可用。我会考虑时间窗口、参与率和谨慎折扣。它仍然是一个思想实验，但脚下有数字。

Tesla：车轮上的硅片

Tesla 在 2025 年 6 月报告了第 800 万辆量产车辆。并不是每一辆都还在使用，并不是每一辆都有相同的 Autopilot 硬件，也不是每位车主都会愿意把自己的车开放给计算网络。因此我保守计算：

800 万辆已生产车辆中，也许 80% 仍然现实地在使用，并且在技术上相关。也就是 640 万辆车。
对于 Hardware 3，也就是 2019 年起的 FSD Computer，系统层面常被提到的数量级是 144 TOPS。
Hardware 4 装在更新的车辆里，也更现代，但 Tesla 没有像早期 Autonomy Day 那样发布干净、简单的 TOPS 数字。因此这次计算仍然用 144 TOPS 作为保守基准值。
一辆车虽然经常一天停放 23 小时，但真正有意思的是充电窗口。如果夜里 接电 6.5 小时，折算到 24 小时平均约为 27% 可用性。

如果只有 25% 的活跃 Tesla 车主加入，那就是 160 万辆车，按日均折算约为 62 Exa operations per second。50% 参与时约为 125 Exa operations per second。如果理论上所有活跃车辆都参与，数字大约是 250 Exa operations per second。夜间窗口本身的瞬时能力更高；日均折算只是为了和 24 小时运行的数据中心做更公平的比较。

iPhone：更大的惊喜

iPhone 的估算同时更简单也更困难。简单，是因为 Apple 每年出货量巨大。困难，是因为 Apple 没有提供一张清晰的公开表格，说明全球仍在使用的 iPhone 分别属于哪些世代。因此我取过去几年的公开出货量，再叠加一个合理的活跃保留率。

年份	出货 iPhone 数量	粗略芯片组合	假设活跃比例	平均 Neural Engine 性能
2021	235.7 百万部	A14/A15	55 %	12 TOPS
2022	226.4 百万部	A15/A16	65 %	16 TOPS
2023	234.6 百万部	A16/A17 Pro	75 %	22 TOPS
2024	233.1 百万部	A16/A17/A18	85 %	30 TOPS
2025	247.8 百万部	A18/A19	95 %	32 TOPS

这个混合估算仅从五个出货年份，就得到约 8.85 亿部可能仍在使用的 iPhone。这不是整个 iPhone 安装基数，而是有意限制的一个切片。较老的 A14/A15 世代处在十几 TOPS 的区间，A16 接近 17 TOPS，A17 Pro 约 35 TOPS。因此按年份取平均，比假装所有设备都搭载同一颗芯片更合理。

现在还是同一套玩法：夜里接电 6.5 小时，不是整天。如果这些设备中有 25% 参与，按日均折算约为 1'437 Exa operations per second。50% 参与时约为 2'875 Exa operations per second。如果理论上全部设备参与，数字约为 5'750 Exa operations per second。

这听起来疯狂。但重点正是这里。不是因为 iPhone 是服务器，而是因为设备数量太大，以至于即使采用谨慎比例，也会突然进入通常只会联想到数据中心的数量级。

对比

作为其他参照点，我取：

5000 万块桌面 GPU、工作站或小型服务器，平均可以提供 20 TFLOPS FP32。如果其中只有 20% 在实践中可用，在合适时间窗口里仍有约 200 Exa operations per second。
数据中心世界的比较对象 xAI Colossus。如果按 200'000 块 Hopper GPU 和每块 H100 数量级约 3'958 INT8-TOPS 计算，可以得到约 792 Exa operations per second 的理论 AI 峰值性能。这是 sparsity peak；密集且持续可用的性能会更低。

理论硅片能力对比

粗略的每秒 Exa operations，按 24 小时平均。Tesla 和 iPhone 按 6.5 小时夜间窗口计算；对 Tesla 和 iPhone，图中显示的是理论参与率，不是今天已经可调用的容量。

Tesla 50 % theoretical

125

PCs / Workstations

200

xAI Colossus

792

iPhones 25 % theoretical

1'437

iPhones 50 % theoretical

2'875

重要：这不是基准测试。FP32-FLOPS、INT8-TOPS 和 Neural Engine TOPS 不能 1:1 互换。内存、互连、软件、验证、能效、平台权限和真实利用率，决定了峰值性能能否变成可用工作。

这不是精确的全球容量，而是一个思维模型。也正是在这里必须刹车：TOPS 不能像几升水一样倒进一个共同水池。iPhone 的 Neural Engine TOPS、GPU 的 INT8 TOPS、工作站的 FP32 性能是不同的东西。许多有意义的任务不只需要计算操作，还需要 RAM、VRAM、内存带宽、稳定运行时间、软件访问，以及一个允许这类任务运行的操作系统。

尽管如此，这个估算说明这个想法并不荒唐。PC、车辆和智能手机的保守组合，作为理论硅片能力，也能达到一个数量级，在世界上最显眼的 AI 数据中心之一旁边，不再显得小到可笑。

iPhone 的数字尤其有趣，因为它只看五个出货年份，而不是整个活跃安装基数。同时它也是说明峰值性能不够的最佳例子：iPhone 不是服务器。它有散热限制、电池逻辑、操作系统规则、隐私模型，还有一个期待第二天早上设备能正常工作的主人。尽管如此，那里仍然有几年前像科幻一样的计算能力。

而且这些峰值也只是峰值。智能手机、无风扇笔记本或汽车控制单元，不能像数据中心 GPU 那样连续六小时输出这种性能。散热、降频和保护逻辑会大幅压低持续性能。任何想把它变成真实网络的人，都必须按持续性能计算，而不是按数据表里最漂亮的数字计算。

也可以从电力角度来想。如果 5000 万台设备平均每天贡献 150 watt、持续 4 小时，那每年约为 11 TWh。这只是当今全球数据中心耗电量的一小部分。但已经足以承担许多后台任务、Embedding、科学工作负载、渲染、验证任务或去中心化存储流程。

令人不舒服的反驳是：这并不自动更高效。数据中心有更好的冷却、更高的利用率、更便宜的电力、更新的硬件和专业的批处理。家用设备每单位有用计算可能更差，尤其是在开销很多，或者智能手机电池为了几分钱 Credits 更快老化时。因此，一个去中心化 Compute Grid 并不会因为分布式就天然更好。它必须对合适的工作负载在净效益上有意义：技术上、能源上、经济上都要如此。

新的 AI PC 让事情更有意思。Canalys 曾预计 2025 年将出货约 1 亿台 AI PC。许多设备配有 40 TOPS 或更高的 NPU。TOPS 不是 GPU-FLOPS，NPU 也不能替代数据中心。但即使非常谨慎地看，也正在出现一类新的本地 AI 硬件，它不只存在于纸面上，而是进入办公室和家庭。

所以重点不是：“我们明天用游戏 PC、Tesla 和 iPhone 替代所有数据中心。”重点是：我们正在建设巨大的新集中式容量，同时，一大批分布式、已经付过钱的容量却闲置并消失。

计算能力会过期

电力可以储存。不是完美地，不是无损地，但原则上可以。如果我的太阳能系统中午生产的电力超过需要，能量会进入电池或电网。晚上我可以再次使用，或者邻居可以使用。Smart Grid、电池储能和点对点能源模型让这种思考越来越具体：有时我生产，有时我消费，客户和供应者之间的边界变得更柔软。

计算能力不一样。

昨天没用掉的 GPU 小时，今天不能从抽屉里拿出来。一个处理器一整夜什么也没做，并不会为以后保留计算能力。那段时间没了。不可挽回。Compute 是会过期的。

这正是闲置设备令人感兴趣的地方。我们拥有的不只是硬件。我们拥有的是持续消失的机会。短期现实的资源池主要是桌面 GPU、工作站、游戏主机、小型服务器、NAS 存储，以及校园或本地服务商的资源。智能手机和汽车更像长期边缘案例：技术上很迷人，但由于电池、散热、平台规则、安全和厂商控制，难度明显更高。

因此，障碍不只在数学，也在激励。最有趣的闲置硅片恰好属于封闭平台：Apple 用 Private Cloud Compute 为大型 Apple Intelligence 请求建设自己的基础设施，Tesla 用 Cortex 为 FSD 和 Optimus 建设自己的训练容量。如果硬件、软件和云的控制权才是真正的护城河，这些公司为什么要把自己的设备车队开放给独立于厂商的计算市场？

尽管如此，根本问题仍然存在：当我们同时建设越来越大的集中式设施时，为什么把分布式计算能力当成无关紧要？

AI 真的能分布式计算吗？

这里必须诚实：今天可见的许多 AI，对去中心化来说很难。

一个大型语言模型不是一串可以随意扔给陌生设备的小任务。模型需要 RAM 或 VRAM，需要内存带宽，有时还需要高速互连。Token 生成会一遍又一遍运行模型，每增加一次网络跳转都会让响应变慢。为了交互式聊天回答，把一个 Frontier Model 拆到陌生智能手机、旧笔记本和汽车上，通常是没有意义的。

但这并不意味着去中心化 AI 不可能。它只意味着必须选择正确的任务。

不需要两秒内完成的工作非常适合：大型档案的 Embedding、批量摘要、渲染、科学模拟、合成数据、测试、抓取、验证任务、去中心化存储修复、小型本地模型、预处理，以及可以检查结果或重复计算的任务。

实践中，任务必须分得更干净：

任务类型	去中心化是否合理？	原因
私有本地推理	是，但应保持本地	数据留在自己的设备或自己的信任空间里。
批量推理和 Embedding	通常是	高吞吐量比秒级延迟更重要。
可验证子任务	如果可检查，就是	结果可以重复计算、证明或通过测试验证。
存储和复制	有规则时是	加密、Erasure Coding、审计和修复机制是这里已知的组件。
Frontier Training 和硬 SLA	更倾向于不是	耦合太强，VRAM 太多，对互连、运营和可用性的要求太高。

大型模型并非完全排除，但需要不同架构。Petals 已经展示，在分布式资源上对大型模型进行协作推理和微调原则上可行。Prime Intellect 通过 INTELLECT-2 又进一步展示，如果结果可以验证，使用不可信 Worker 的分布式 Reinforcement Learning 如何工作。这还不是你的 iPhone 夜里偷偷训练 GPT-7 的世界。但它说明问题并非根本不可能。

因此，现实起点不是：“把一个巨大模型横跨一切分布出去。”现实起点是：本地模型优先，为合适的批量任务建立区域资源池，可验证任务，清晰的数据区域，并且只有真正必要时才使用集中式数据中心。

分布式系统的旧梦

互联网还有另一种叙事。它听起来不像大教堂，更像蜂群。

志愿计算

SETI@home 对我来说一直是最美的例子之一。数百万人让自己的电脑在后台计算射电天文学数据。不是因为他们得到了一个 SaaS 仪表板，而是因为那个想法足够大：我们一起在宇宙的噪声中寻找信号。自 2020 年 3 月以来，SETI@home 不再分发新的 Work Units，进入了一种休眠状态。但作为志愿计算可以在全球规模运行的证明，它仍然重要。

BOINC，也就是其背后和旁边的平台，冷静地解释了为什么这能工作：许多独立、计算密集型的任务，其中吞吐量比低延迟更重要。这正是关键区别。分布式系统不需要把每个交互式聊天回答都在两秒内交付。它可以在工作可拆分、可验证、不需要立刻完成的地方变强。

没有固定位置的存储

IPFS 把同样的思想带入存储领域。文件主要不是通过某个位置寻址，而是通过内容寻址。内容有指纹。谁拥有它，谁就能提供它。这和“这个文件在这个服务器的这个 URL 下”是另一种思维方式。

没有中央记账的货币

Bitcoin 不管人们如何评价投机和能耗，都普及了一种类似的原始想法：没有中央记账的系统，共识不依赖单一机构。不是每个去中心化想法都自动好。但 Bitcoin 展示了，当协议移除中央控制点时，它可以具有政治力量。

作为网络的存储

存储方面也有过有趣尝试。Symform 是一个去中心化云存储提供商，可以把多余存储贡献到网络里。2014 年该平台被 Quantum 收购；当时提到 170 个国家里的 45'000 名用户和小型企业。Storj、Sia、Filecoin 以及其他变体也说明：这个想法并不新。只是它从未完全进入日常。

今天，这个想法以新形式继续存在。Storj 在客户端加密文件，把它们拆成片段并分发到许多 Storage Nodes。它更接近基础设施，而不是浪漫：用户最好看不见蜂群，只看见一个能工作的存储服务。

作为市场的 Compute

Golem 和 Akash 想把闲置计算能力变成可访问的市场。对我来说，这是通往本文的直接桥梁：分散在各处的不只是存储空间，还有处理器、GPU 和小型服务器，它们今天常常处于空闲。

分布式蜂群里的 AI

Andrej Karpathy 也在这个环境里再次出现：Prime Intellect 把他列为知名支持者，而 Prime Intellect 通过 INTELLECT-2 启动了一轮针对 32B 参数模型的去中心化分布式 RL 训练，异构、无需许可的计算资源可以参与。

这还不是完美答案。但它说明：这个梦想没有消失。它只是一次又一次寻找能在真实运营中存活的形式。

向虚拟电厂学习

有意思的是，在电力领域，这种思路早已不那么奇特。

Tesla 把自己的 Virtual Power Plant 描述为分布式能源的网络：拥有太阳能系统和 Powerwall 的家庭被合起来看作一个电厂。当电网需要支持时，电池可以释放电力。屋主提供资源，并因此得到金钱或其他好处。单个 Powerwall 很小。但合在一起，它们可以对电网变得重要。

这正是 Compute 里让我着迷的类比。家庭办公室里的一块 GPU、一个 NAS、一部 iPhone 或一辆车不是数据中心。但许多设备合在一起，可能形成一层新的东西：不是为了一切，不是随时，不是没有规则，而是为特定任务服务。

这个类比有边界。电力比计算工作更可替代。一千瓦时不会取决于它现在要运行 80 GB VRAM 的模型、Embedding Pipeline，还是加密的存储修复。Compute 与工作负载有关。因此需要任务类型、调度和明确排除项。

在 Tesla 那里，同一个想法甚至出现在两处。Powerwall 可以成为虚拟电厂的一部分。汽车未来则被设想为自动驾驶 Robotaxi 车队的一部分，也就是在车主自己不用时赚钱。它是否以及多快真正扩大规模，是另一个问题。但基本想法很重要：私人设备不再只是被消费，而可以在空闲时间窗口里作为基础设施工作。

Compute 也可以这样想。不是把电卖给邻居，而是把可验证的计算时间、存储空间或模型工作卖给一个区域单元。用户最终承担电力、热量、硬件磨损和风险。因此也必须获得报酬。没有这一点，这个想法只是漂亮的技术实验。

为什么蜂群很少获胜

如果去中心化听起来这么美，为什么它没有轻易胜出？

因为集中化往往是更好的产品组合。

数据中心是可控的。蜂群由陌生设备、不同操作系统、变化的可用性、较差的可预测性，以及可能关闭、出售、更新或断开设备的拥有者组成。对产品经理来说，这不是浪漫，而是头痛。

然后是经济性。许多去中心化项目试图用 Token 解决激励。这可以理解，因为没有中心公司的网络仍然需要报酬。但一旦存储或计算时间的成本绑定到波动货币，对普通企业来说就不再有吸引力。我不希望自己的 1 TB 备份突然变贵，只因为某个 Coin 在 Twitter 上被炒作。我也不希望 GPU 小时预算依赖一个感觉更像赌场而不是基础设施的市场。

而且价格对手不是云里最贵的按需 GPU。真正的比较对象是 Spot 和 Preemptible 产品，也就是提供商以显著折扣出售的、原本就多余的数据中心容量。因此去中心化计算网络不能只是哲学上更漂亮。它必须能对抗非常便宜、集成良好、尽管可中断的云容量。

第二个阻力是便利性。S3 不是因为哲学上漂亮而获胜。它赢是因为足够简单、文档足够好，并且到处都已集成。如果去中心化存储或计算网络想变得相关，它们对开发者和管理员来说必须几乎无聊：放入 API key，创建 Bucket，监控，账单，SLA，恢复测试，完成。

接着是安全。在企业网络里，不应该突然有某个外部计算任务以入站方式落到工作站上。任何合理的防火墙都会阻止它，威胁情报系统也会觉得可疑。实际中，这类系统更应该从内向外工作：节点向某个单元报到，取回已检查的任务，在沙箱中运行，只看到它被允许看到的数据。否则，一个合法计算网络在网络层上很快会看起来像一个措辞非常礼貌的 Botnet。

信任是下一个硬点。去中心化系统必须能证明工作已被正确完成，而不让每个节点看到一切。存储里有已知组件：加密、Erasure Coding、审计、修复机制。AI 和 Compute 会更难。我如何检查一个陌生设备是否正确执行了模型？如何防止数据外泄？如何保护参与者的设备免受外部代码影响？

硬件磨损也不只是电。SSD 和 NVMe 存储有写入寿命。如果模型权重、临时数据、Embedding 批次或 Swap 文件不断写入消费级设备，就会消耗真实寿命。还有带宽问题：如果下载大型模型或数据集所需时间和网络开销超过实际计算，账就算不通。数据比简单的 Smart Grid 类比暗示的更重。

也正是在这里，INTELLECT-2 变得有趣。Prime Intellect 在论文中把 TOPLOC 描述为一个组件，用来验证不可信推理 Worker 的 Rollout。它并不会突然解决所有 Compute 问题。它也不是把任意企业数据放在外部硬件上的魔法隐私方案。但它为某一类分布式 AI 工作展示了真实机制：任务被构造成结果可验证，而不是盲目信任每个 Worker。

对于机密数据，单靠这个不够。那里需要其他组件：Confidential Computing、Trusted Execution Environments、Remote Attestation、干净的沙箱、清晰的数据分类，以及在必要时做出硬决定，让某些任务根本不要跑在外部硬件上。还要加上一些无聊但决定性的题目：税务、责任、隐私、数据驻留，以及互联网服务商的条款。基础设施很少只因为数学失败。它通常失败在运营。

一个 Compute Smart Grid

我想象的不是天真的“所有东西都是 P2P，然后一切都会变好”。基础设施不是这样运作的。可能可行的是一个有清晰层次的 Compute Smart Grid。

第一层叫本地优先。凡是个人、机密或延迟敏感的东西，都应该尽可能运行在自己的设备或自己的信任空间里。小模型、本地搜索、私有摘要、简单分类、预处理、加密、个人数据的 Embedding。不是每封邮件、每条笔记、每次搜索都必须去 Hyperscaler。

第二层是区域化和联邦化。一个城市、街区、校园、企业、合作社或服务商可以运行一个单元。在这个单元里，设备自愿提供资源，但必须在清晰条件下：只在接电时，只在空闲时，只在散热边界内，只以定义好的最大功率运行，只用于特定任务类型。

起点不是智能手机和汽车，而是更无聊的设备：桌面 GPU、工作站、游戏主机、小型服务器、NAS 系统以及本地服务商的空闲容量。智能手机以后可以承担小型验证任务。汽车更晚才可能，而且只能在非常狭窄、由厂商控制的边界内。就像电网一样，必须先从可靠、可测量、可控制的资源开始。

第三层仍然是集中式。Frontier Training、严格实时、极大模型、监管敏感的特殊案例以及高度耦合的工作负载，仍然属于专业数据中心。去中心化不需要取代一切。它只需要阻止每一项日常工作都自动流经同样五个权力中心。

如果要测试，我会从小处开始。不是数百万部 iPhone，而是一个由 500 到 2'000 个志愿桌面 GPU、工作站、NAS 系统和小型服务器组成的区域单元。允许的任务类型只有少数几种：非敏感数据的 Embedding、科学批处理任务、加密存储片段和验证任务。成功不看漂亮的 Exa 数字，而看三个无聊指标：每 $1 电力成本完成的任务数，错误和重复率，扣除硬件磨损后的报酬。

最难的是报酬。用户承担电力、热量和硬件磨损。因此他需要得到回报。也许确实需要 Token 或 Credit。但不是作为投机对象，而是作为基础设施余额。

这样的 Compute Credit 必须代表某种真实东西：某一类别的 GPU 分钟、一个 GB-month 存储、一次已验证推理、一个批量 Embedding 单元，或一个 kWh-equivalent 计算单元。提供资源的人赚取 Credits。后来自己需要 AI 能力时，就消耗它们。不想消耗的人可以兑换成法定货币，就像在虚拟电厂里，人们不想拿“Powerwall Coins”，而是想拿真钱或清晰的账面抵扣。

但这并不会神奇地解决定价问题。稳定性需要锚：法币结算、能源价格区间、区域清算机构、合作社费率或受监管运营商。没有治理，“稳定 Credits”很快又会变成自由波动的 Token。然后旧问题回来：基础设施感觉像赌场。

更重要的是运营权。我们不必自己训练每一个大型 Foundation Model。也许可以购买或授权模型、开放权重或模型家族，然后以去中心化、联邦化、区域可控的方式运行它们。真正的主权不仅在训练，也在运营：模型在哪里运行？数据在哪里？谁可以审计？有没有回到提供商的回传通道？当政治、价格或条款改变时，我能否继续在本地运行模型？

为了让这不只是漂亮的采购合同，这类授权必须包含真正的运营权：本地部署、长期更新和安全承诺、可追溯的模型卡、可审计性、明确退出权，并且不能强制把敏感数据重新推回中央厂商云。这不是纯粹的去中心化乌托邦。但它是在天真自给自足和彻底平台锁定之间的一条现实路径。

设备计算的那个夜晚

想象一下，现在是 22:43。你带 GPU 的桌面电脑处于空闲状态，NAS 在线，手机在充电。你在设置里规定：最多 80 watt，只在空闲时，只接收本区域已检查的工作负载，并且只有当报酬覆盖电费加硬件折旧时才运行。

一个本地代理报告空闲容量。不是用你的名字，也不是用你的私人数据，而是作为一个具有特定能力、已被证明的节点。区域单元分发小任务：模拟、Embedding、加密存储片段、验证任务。

早晨，没有火箭，没有 Wall Street 故事，没有炒作 Token。只有一行冷静的文字：

今夜：赚取 2.4 GPU Credits，确认 18 GB-months 存储，估计 $0.31 电费。

之后，你把这些 Credits 用在自己文档上的本地模型。敏感数据留在你这里。你不只是客户。你也是参与者。

这听起来很浪漫。是的。但有时候，正是这种感觉，才是认真对待一个困难工程问题的理由。

蜂群与高山

我不认为集中式数据中心会消失。它们太高效、太重要，而且对某些任务来说就是必要的。高山会留下。问题只是，我们是否在旁边重新铺一层地面。

一层由本地设备、区域单元、开放协议、稳定 Credits 和清晰安全模型构成的地面。在那里，算力不只是自上而下被出售，而是在参与者之间流动。在那里，某些 AI 工作运行在它本该运行的地方：私人工作在本地，区域工作在区域内，全球边缘案例在数据中心里。

也许这很天真。也许不是。虚拟电厂曾经也是一个奇怪想法：成千上万块小电池组成一个大网络。去中心化货币长期听起来很荒唐。汽车自主当出租车运行，也曾像科幻。不是所有承诺都会按原样到来。但方向很清楚：过去被动闲置的资源，越来越被当作更大系统的一部分来思考。

此刻，到处都有闲置机器。公寓、办公室、车库、服务器机房和口袋里。不是每一台都同样适合。不是每一台都应该执行外部工作。但很多已经在那里，已经付过钱，并且已经联网。而每一个未使用的秒都会消失。

也许我们应该开始倾听它们。

下次见，
Joe

来源