私たちの周りにある使われていない計算能力

2026年6月3日 • 3 min read

大きなインフラの問いは、たまにとても小さな光景から始まります。スマートフォンが夜、充電器につながっている。ノートPCは閉じられている。ゲーム機はリビングで待機している。車はガレージに停まっている。あちこちに、すでに支払われ、電力も供給され、ほとんど何もしていない計算能力があります。

同時に、新しいデータセンターが産業施設のような規模で建てられています。GPU、光ファイバー、変圧器、冷却技術、電力契約で満たされたホール。私たちはいま、書くこと、探すこと、プログラムすること、分析すること、そしていつかは判断することまで支える、新しいデジタルインフラの層を作っています。

もし、その能力の小さな一部がただ失われずに済むとしたらどうでしょうか。すべてのスマホが突然データセンターを置き換える、という荒唐無稽な話ではありません。もっと真面目な思考実験です。デバイスが自発的に、制限付きで、対価を受け取りながら計算能力を提供する、一種のCompute Smart Gridはあり得るのでしょうか。

PRISMからプロンプトへでは、この流れのもう一つの側面、つまり少数のAIプラットフォーム、とくに米国と中国のプラットフォームへの依存が大きくなることを扱っています。ここで私が気になるのは、その反対の発想です。素朴なP2Pロマンではなく、技術的な問いとして。どれほどの計算能力がすでに分散して存在しているのか。どのAIタスクなら分散できるのか。そして、人々がそれに対して公平に報酬を受け取るには何が必要なのか。

計算能力は保存できません。使われなかったGPU時間は予備ではありません。ただ消えていきます。

思考実験

AIは単なるソフトウェアではありません。AIは電力、冷却、光ファイバー、GPU、土地、水、資本です。International Energy Agency は、2024年に世界中のデータセンターが約415 TWhの電力を消費したと推定しています。これは世界の電力消費の約1.5パーセントです。2030年には約945 TWhに達する可能性があります。

これはサステナビリティ報告書のためだけの数字ではありません。インフラ政策です。AIサービスは7x24で利用可能です。要約も、コードの質問も、画像も、エージェントの実行も、すべて計算です。そして何十億もの人や企業が仕事をAIのループに入れると、それは基礎負荷になります。

だから、大きな集中型ソリューションに惹かれる理由は理解できます。データセンターは制御しやすい。同じハードウェア、同じラック、同じネットワーク、明確なセキュリティゾーン、SLA、監視、課金。運用目線では魅力的です。しかし政治的、経済的、アーキテクチャ的には、ネットをいつも脆弱にしてきたものをまた作ります。少数の権力中心です。

だから、この思考実験は単純な逆質問から始まります。次のデータセンターを建てる前に、すでにそこにあるものは何か。

未使用の容量はどれほど大きいのか

このアイデアは、実はとても日常的な瞬間から生まれます。スマートフォンが夜、ベッドサイドテーブルに置かれ、電源につながり、ほとんど何もしていません。しかし内部には、10年前の多くのコンピュータが全体として持っていた能力を超えるAI専用の計算能力を備えたチップがあります。A17 Proを搭載したiPhone 15 Proは、1秒あたり約35兆回のNeural Engine処理に達します。慎重な平均値だけを取っても、夜の大半を待機に使うデバイスとしては途方もない量です。

机の上でも同じことが起きています。新しいノートPCにはCPUとGPUだけでなく、NPUやNeural Engineもあります。Appleは何年も前から自社チップにNeural Engineを組み込んでいます。WindowsノートPCは、専用AIプロセッサを搭載したAI PCとして登場しています。リビングのゲーム機には、かつてならワークステーションのように聞こえたGPU性能があります。それでも私たちは、このローカルの計算能力をほとんど短いピークでしか使いません。ゲーム、書き出し、ビデオ通話、ローカル効果、検索。その後、デバイスはまたアイドル状態に戻ります。

ここから思考実験が始まります。「明日からiPhoneをデータセンターとして貸せるのか」という話ではありません。それは無理があります。そうではなく、すでに支払われ、ネットワークにつながり、毎晩電源に接続されているシリコンがこれほどあるなら、小さく、安全で、適切な時間枠だけを使った場合、理論上の容量はどれほどになるのか、という問いです。

世界のこの未使用の計算能力を正確に測ることはできません。デバイスはあまりに多様で、多くはオフラインで、バッテリー、熱、セキュリティ、プラットフォーム上の理由から参加できないものも多い。それでも大まかな外挿は、規模感をつかむ助けになります。

そのために、意図的に単純なブロックをいくつか置きます。重要なのは、すべてのデバイスが常に完全に利用可能だと仮定しないことです。時間枠、参加率、慎重な割引を入れて計算します。これは思考実験のままですが、足元に数字があります。

Tesla: 車輪の上のシリコン

Teslaは2025年6月、800万台目の生産車を発表しました。すべてがまだ稼働中とは限らず、すべてに同じAutopilotハードウェアがあるわけでもなく、すべての所有者が自分の車をComputeネットワークに開放したいわけでもありません。そこで保守的に計算します。

生産された800万台のうち、現実的にまだ稼働中で技術的にも対象になり得るのはおそらく 80パーセント。つまり 640万台 です。
Hardware 3、つまり2019年以降のFSD Computerについては、システムとして 144 TOPS 程度の規模がよく言及されます。
Hardware 4は新しい車両に搭載され、より新しい世代ですが、Teslaは古いAutonomy Dayの数字のような、きれいで単純なTOPS値を公開していません。そのためこの計算では、それでも 144 TOPS を保守的な基準値として使います。
車は1日23時間ほど停まっていることも多いですが、本当に面白いのは充電時間帯です。夜に 6.5時間電源につながる と、24時間平均では約 27パーセント の可用性になります。

稼働中のTesla所有者のうち 25パーセント だけが登録した場合、160万台となり、24時間平均の一日換算で約 62 Exa operations per second になります。50パーセント の参加なら約 125 Exa operations per second。理論上すべての稼働車両が参加すれば、約 250 Exa operations per second です。夜間の時間枠そのものでは瞬間性能は高くなりますが、一日換算の数字は24時間動くデータセンターとの比較として公平です。

iPhones: より大きな驚き

iPhoneの計算は、簡単でもあり難しくもあります。簡単なのは、Appleが毎年膨大な台数を出荷しているからです。難しいのは、どのiPhone世代が世界でまだ稼働しているのか、Appleが明確な公開表を出していないからです。そこで直近数年の公開出荷台数を使い、その上に妥当そうな稼働残存率を置きます。

年	出荷されたiPhone	大まかなチップ構成	想定稼働率	平均Neural Engine性能
2021	235.7 million	A14/A15	55 %	12 TOPS
2022	226.4 million	A15/A16	65 %	16 TOPS
2023	234.6 million	A16/A17 Pro	75 %	22 TOPS
2024	233.1 million	A16/A17/A18	85 %	30 TOPS
2025	247.8 million	A18/A19	95 %	32 TOPS

この混合計算では、5年分の出荷だけで約 8億8,500万台の、おそらくまだ稼働しているiPhone になります。これはiPhoneの利用基盤全体ではなく、意図的に限った範囲です。古いA14/A15世代は10 TOPS台前半から半ば、A16は約17 TOPS、A17 Proは約35 TOPSです。だから全デバイスが同じチップを持つふりをするより、年ごとの平均の方が意味があります。

また同じ計算です。夜に電源につながる6.5時間で、丸一日ではありません。これらのデバイスの 25パーセント が参加すれば、一日換算で約 1'437 Exa operations per second になります。50パーセント なら約 2'875 Exa operations per second。理論上すべてのデバイスが参加すれば、約 5'750 Exa operations per second です。

これは馬鹿げて聞こえます。しかし、まさにそこがポイントです。iPhoneがサーバーだからではありません。デバイスの数があまりに大きいため、慎重な比率でも突然、通常はデータセンターにしか期待しない規模に入ってしまうのです。

比較

さらに比較点として、次を置きます。

5,000万台のデスクトップGPU、ワークステーション、小型サーバー。平均で20 TFLOPS FP32を出せるとします。そのうち実用的に使えるのが20パーセントだけでも、適切な時間枠では約 200 Exa operations per second が残ります。
データセンター側の比較として xAI Colossus。200'000基のHopper GPUと、H100規模の約3'958 INT8-TOPSを使うと、理論上のAIピーク性能は約 792 Exa operations per second になります。これはsparsity peakであり、密な計算で継続的に使える性能はもっと低いです。

理論上のシリコン比較

1秒あたりのおおまかなExa operationsを、24時間平均にしたもの。TeslaとiPhoneは6.5時間の夜間枠で計算しています。TeslaとiPhoneについて、この図は理論上の参加率を示しており、今日すぐ利用できる容量ではありません。

Tesla 50 % 理論値

125

PC / ワークステーション

200

xAI Colossus

792

iPhone 25 % 理論値

1'437

iPhone 50 % 理論値

2'875

重要: これはbenchmarkではありません。FP32-FLOPS、INT8-TOPS、Neural Engine TOPSは1:1で交換できません。メモリ、インターコネクト、ソフトウェア、検証、エネルギー効率、プラットフォーム上の権利、そして実際の稼働率が、ピーク性能を使える仕事に変えられるかを決めます。

これは正確な世界容量ではありません。思考モデルです。そして、ここでブレーキをかける必要があります。TOPSは、水のリットルのように共通のプールへ注げるものではありません。iPhoneのNeural Engine TOPS、GPUのINT8 TOPS、ワークステーションのFP32性能は別物です。多くの有用なジョブには、計算操作だけでなくRAM、VRAM、メモリ帯域、安定した実行時間、ソフトウェアアクセス、そしてそうしたジョブを許すOSが必要です。

それでも、この計算はアイデアが笑い話ではないことを示します。PC、車両、スマートフォンの保守的な組み合わせだけでも、理論上のシリコンとして、世界で最も目立つAIデータセンターの一つと並べても極端に小さいとは言えない規模になります。

とくにiPhoneの数字は面白い。これは稼働中のインストールベース全体ではなく、5年分の出荷だけを見ています。同時に、ピーク性能だけでは不十分だという最高の例でもあります。iPhoneはサーバーではありません。熱の制限、バッテリー制御、OSのルール、プライバシーモデルがあり、朝には問題なく動くデバイスを期待する所有者がいます。それでもそこには、数年前ならSFのように見えた計算能力があります。

そしてこのピーク値も、あくまでピーク値です。スマートフォン、ファンレスノート、車載制御ユニットは、データセンターGPUのように6時間連続でその性能を出せません。熱、スロットリング、保護ロジックが持続性能を大きく下げます。実際のネットワークを作るなら、データシートの一番きれいな数字ではなく持続性能で考えなければなりません。

電力で考えることもできます。5,000万台のデバイスが平均150 wattを1日4時間提供すると、年間で約11 TWhになります。これは現在の世界のデータセンター消費電力の小さな一部にすぎません。しかしバックグラウンドジョブ、埋め込み、科学計算ワークロード、レンダリング、検証タスク、分散ストレージ処理の多くを支えるには十分です。

不快な反論は、これが自動的に効率的になるわけではないという点です。データセンターには、より良い冷却、より良い稼働率、安い電力、新しいハードウェア、専門的なバッチ処理があります。家庭のデバイスは、有用な計算あたりでは効率が悪い場合があります。オーバーヘッドが多い場合や、数セントのクレジットのためにスマートフォンのバッテリーが早く劣化する場合は特にそうです。だから分散型Compute Gridは、分散しているだけで良いわけではありません。適切なワークロードに対して、技術的、エネルギー的、経済的に正味で意味がなければなりません。

新しいAI PCによって、話はさらに面白くなります。Canalysは2025年に約1億台のAI PCが出荷されると見込んでいました。こうしたデバイスの多くは40 TOPS以上のNPUを持ちます。TOPSはGPU-FLOPSと同じではなく、NPUはデータセンターを置き換えません。それでも非常に慎重に見ても、紙の上だけでなく、オフィスや家庭に届くローカルAIハードウェアの新しい階層が生まれています。

つまり結論は、「明日すべてのデータセンターをゲーミングPC、Tesla、iPhoneで置き換える」ではありません。結論は、巨大な新しい中央容量を建設している一方で、すでに支払われた巨大な分散容量が未使用のまま失われている、ということです。

計算能力は腐る

電力は保存できます。完全ではなく、損失ゼロでもありませんが、原理的にはできます。太陽光発電が昼に必要以上に発電すれば、エネルギーはバッテリーか送電網に入ります。夕方に自分で使うことも、隣人が使うこともできます。スマートグリッド、蓄電池、ピアツーピアのエネルギーモデルは、この考え方をどんどん具体的にしています。ある時は生産し、ある時は消費し、顧客と提供者の境界は柔らかくなります。

計算能力は違います。

昨日使わなかったGPU時間を、今日引き出しから取り出すことはできません。一晩何もしなかったプロセッサは、後のために計算能力を残していません。その時間は消えました。戻りません。Computeは腐りやすいのです。

だから未使用のデバイスは面白いのです。私たちはハードウェアだけを持っているのではありません。絶えず失われる可能性を持っています。短期的に現実的なプールは、主にデスクトップGPU、ワークステーション、ゲーム機、小型サーバー、NASストレージ、キャンパスやプロバイダーのリソースです。スマートフォンと車は、より長期の周辺ケースです。技術的には魅力的ですが、バッテリー、熱、プラットフォーム規則、セキュリティ、メーカーの管理のため、はるかに難しい。

つまり失敗するのは数学だけではなく、インセンティブでもあります。最も面白い余剰シリコンを持つデバイスは、よりによって閉じたプラットフォームに属しています。Appleは大きなApple IntelligenceリクエストのためにPrivate Cloud Computeという自前のインフラを作り、TeslaはFSDとOptimusのためにCortexという自前の学習容量を作っています。ハードウェア、ソフトウェア、クラウドの管理こそが堀であるなら、なぜこうした企業が自社の車両やデバイス群を、メーカーから独立したCompute市場に開くのでしょうか。

それでも根本の問いは残ります。より大きな中央施設を作り続けているのに、なぜ分散した計算能力を無関係なもののように扱うのでしょうか。

AIはそもそも分散して計算できるのか

ここでは正直でなければなりません。今日見えているAIの多くにとって、分散化は難しいです。

大きな言語モデルは、見知らぬデバイスへ適当に投げられる小さなタスクのリストではありません。モデルにはRAMかVRAMが必要です。メモリ帯域が必要です。場合によっては高速なインターコネクトも必要です。トークン生成ではモデルが何度も走り、余分なネットワークホップは応答を遅くします。対話型チャット回答のためにフロンティアモデルを見知らぬスマートフォン、古いノートPC、車に分割するのは、多くの場合ナンセンスです。

しかし、それは分散型AIが不可能だという意味ではありません。正しいタスクを選ぶ必要がある、という意味です。

2秒で終わる必要がない仕事はよく合います。大規模アーカイブの埋め込み、バッチ要約、レンダリング、科学シミュレーション、合成データ、テスト、クロール、検証タスク、分散ストレージの修復、小さなローカルモデル、前処理、そして結果を確認したり複数回計算させたりできるタスクです。

実務的には、タスクをもっときれいに分ける必要があります。

ジョブ種別	分散化に向いているか	理由
プライベートなローカル推論	はい、ただしローカルで	データは自分のデバイスか自分の信頼空間に残ります。
バッチ推論と埋め込み	多くの場合はい	秒単位のレイテンシより高いスループットが重要です。
検証可能な部分ジョブ	確認できるならはい	結果は複数回計算したり、証明したり、テストで確認できます。
ストレージと複製	ルールがあればはい	暗号化、erasure coding、監査、修復機構は既知の構成要素です。
フロンティア学習と厳しいSLA	むしろいいえ	結合が強すぎ、VRAMも多すぎ、インターコネクト、運用、可用性への要求が高すぎます。

大規模モデルが完全に除外されるわけではありませんが、別のアーキテクチャが必要です。Petalsは、分散リソースによる大規模モデルの協調推論とfine-tuningが原理的に可能であることを示しました。Prime IntellectはINTELLECT-2でさらに一歩進み、結果を検証できれば、信頼できないワーカーによる分散型Reinforcement Learningがどう機能するかを示しています。これは、あなたのiPhoneが夜中にこっそりGPT-7を学習する世界ではまだありません。しかし問題が根本的に不可能ではないという手がかりです。

だから現実的な出発点は、「巨大なモデルをあらゆるものに分散する」ではありません。現実的な出発点は、ローカルモデルを先に、適切なバッチジョブのための地域プール、検証可能なタスク、明確なデータゾーン、そして本当に必要な場所だけ中央データセンター、という考え方です。

分散システムの古い夢

インターネットにはもう一つの物語があります。大聖堂というより、群れに近い物語です。

ボランティア計算

SETI@homeは、私にとっていつも最も美しい例の一つでした。何百万人もの人が、自分のコンピュータで電波天文学のデータをバックグラウンド計算させました。SaaSダッシュボードを受け取るためではなく、アイデアが大きかったからです。宇宙の雑音の中から、みんなで信号を探す。2020年3月以降、SETI@homeは新しいWork Unitsを配布しておらず、一種の休眠状態にあります。それでも自発的な分散計算が世界規模で機能し得る証拠として重要です。

その背後にあり、隣にもあるプラットフォームであるBOINCは、なぜそれが機能するかを冷静に説明します。独立した計算集約型ジョブが多数あり、低レイテンシよりスループットが重要だからです。これが決定的な違いです。分散システムは、すべての対話型チャット回答を2秒で届ける必要はありません。作業が分割可能で、検証可能で、すぐに必要でない場所で強くなれます。

固定された場所を持たないストレージ

IPFSは同じ考えをストレージ領域へ持ち込みます。ファイルは主に場所ではなく内容でアドレスされます。内容にはフィンガープリントがあります。それを持っている人が届けられます。これは「このファイルはこのサーバーのこのURLにある」という考え方とは別物です。

中央台帳のないお金

Bitcoinは、投機やエネルギー消費をどう評価するかとは独立に、似た原初的なアイデアを広めました。中央の帳簿管理がないシステムであり、合意形成が一つの機関に依存しないという考えです。すべての分散型のアイデアが自動的に良いわけではありません。しかしBitcoinは、中央の制御点を取り除くプロトコルが政治的に強力になり得ることを示しました。

ネットワークとしてのストレージ

ストレージでも面白い試みがありました。Symformは分散型クラウドストレージ事業者で、余ったストレージをネットワークに持ち込めました。2014年にプラットフォームはQuantumに買収され、その時点で170カ国の45'000ユーザーと小規模企業が言及されていました。Storj、Sia、Filecoinなどの変種も同じことを示しています。アイデアは新しくありません。ただ、日常に完全には届いていないのです。

今日、このアイデアは新しい形で生きています。Storjはファイルをクライアント側で暗号化し、断片に分け、多くのStorage Nodesへ配ります。これはロマンというよりインフラに近い。ユーザーは理想的には群れを見るのではなく、機能するストレージサービスを見るだけです。

マーケットプレイスとしてのCompute

GolemとAkashは、未使用の計算能力をマーケットプレイスとして利用可能にしようとしています。これは私にとってこの記事への直接の橋です。分散しているのはストレージ容量だけではなく、プロセッサ、GPU、小型サーバーも同じで、今日それらはしばしばアイドルのままです。

分散した群れの中のAI

Andrej Karpathyもこの周辺で再び登場します。Prime Intellectでは著名な支援者として言及され、Prime IntellectはINTELLECT-2で、異種混在かつpermissionlessな計算リソースが参加できる32Bパラメータモデルの分散型RL学習ラウンドを始めました。

これはまだ完璧な答えではありません。しかし、夢が消えていないことを示しています。夢はただ、実運用で生き残れる形を何度も探しているだけです。

Virtual Power Plantから学ぶ

興味深いのは、電力分野ではこの考え方がすでにそれほど異様に聞こえなくなっていることです。

Teslaは自社のVirtual Power Plantを、分散したエネルギー源のネットワークとして説明しています。太陽光発電とPowerwallを持つ家をまとめ、一つの発電所のように扱う。電力網が支援を必要とするとき、バッテリーは電力を供給できます。所有者はリソースを提供し、その代わりにお金やその他のメリットを受け取ります。個々のPowerwallは小さい。しかし一緒なら電力網にとって重要になれます。

Computeで私を惹きつけるのは、まさにこの類推です。ホームオフィスの一つのGPU、一つのNAS、一つのiPhone、一台の車はデータセンターではありません。しかし多くのデバイスが集まれば、新しい層を作れるかもしれません。すべてのためではなく、いつでもではなく、ルールなしではなく、特定のタスクのために。

類推には限界があります。電力は計算作業よりずっと代替可能です。1 kilowatt-hourは、それが80 GB VRAMのモデル、埋め込みパイプライン、暗号化されたストレージ修復のどれを実行するかに依存しません。Computeはワークロード依存です。だからジョブ種別、スケジューリング、明確な除外条件が必要です。

Teslaでは同じ考えが二つの場所に見えます。PowerwallはVirtual Power Plantの一部になれます。車は将来的に自動運転Robotaxiフリートの一部となり、所有者が自分で使っていないときにお金を稼ぐとされています。それが本当にどれほど速く拡大するかは別の問いです。しかし基本のアイデアは重要です。私有デバイスはただ消費されるだけではなく、空いている時間枠でインフラとして働けるようになります。

Computeも同じように考えられます。隣人に電力を売るのではなく、地域セルに検証可能な計算時間、ストレージ容量、モデル作業を売る。ユーザーは最終的に電力、熱、ハードウェアの摩耗、リスクを負担します。だからユーザーは報酬を受ける必要があります。この点がなければ、アイデアはきれいな技術実験にすぎません。

なぜ群れはめったに勝たないのか

分散化がそれほど美しく聞こえるなら、なぜ簡単に勝たないのでしょうか。

集中化の方が、しばしば優れた製品パッケージだからです。

データセンターは制御しやすい。群れは、見知らぬデバイス、異なるOS、変わり続ける可用性、低い予測可能性、そしてデバイスを切ったり、売ったり、更新したり、ネットワークから切り離したりする所有者でできています。プロダクトマネージャーにとって、これはロマンではなく頭痛です。

さらに経済性があります。多くの分散型プロジェクトは、インセンティブをトークンで解こうとしました。それは理解できます。中央の会社がなくてもネットワークには報酬が必要だからです。しかしストレージや計算時間のコストが変動の激しい通貨に結びついた瞬間、普通の企業には魅力がなくなります。Twitterでコインがpumpされたから、自分の1テラバイトのバックアップが突然高くなるのは嫌です。GPU時間の予算が、インフラというよりカジノのように見える市場に依存するのも嫌です。

そして価格面の相手は、クラウドで最も高いオンデマンドGPUではありません。本当の比較相手はSpotやPreemptibleの提供です。つまり事業者が大幅な割引で売る、もともと余っているデータセンター容量です。したがって分散型Computeネットワークは、哲学的に美しいだけでは足りません。非常に安く、よく統合された、たとえ中断可能でもクラウド容量に対抗しなければなりません。

二つ目のブレーキは利便性です。S3は哲学的に美しいから勝ったのではありません。十分にシンプルで、十分に文書化され、どこにでも統合されていたから勝ちました。分散型ストレージやComputeネットワークが重要になりたいなら、開発者や管理者にとってほとんど退屈に感じられる必要があります。API keyを入れる、bucketを作る、監視、請求書、SLA、復旧テスト、終わり。

次にセキュリティです。企業ネットワークで、見知らぬComputeジョブが突然インバウンドでワークステーションに入ってくるべきではありません。まともなファイアウォールならブロックし、Threat Intelligenceシステムには不審に見えます。実際には、こうしたシステムは内側から外側へ動くべきです。ノードがセルに連絡し、検証済みのジョブを取得し、サンドボックスで実行し、見てよいデータだけを見る。そうしなければ、正当なComputeネットワークもネットワーク層ではすぐに、とても丁寧に書かれたボットネットのように見えます。

信頼は次の硬いポイントです。分散システムは、各ノードにすべてを見せずに、作業が正しく完了したことを証明できなければなりません。ストレージには既知の構成要素があります。暗号化、erasure coding、監査、修復機構です。AIとComputeではさらに難しくなります。見知らぬデバイスがモデルを正しく実行したかどう確認するのか。データ流出をどう防ぐのか。参加者のデバイスを外部コードからどう守るのか。

ハードウェアの摩耗は電力以上の問題です。SSDとNVMeストレージには書き込み上限があります。モデル重み、一時データ、埋め込みバッチ、swapファイルを消費者向けデバイスに絶えず書き込めば、本物の寿命を消費します。帯域幅の問題もあります。大きなモデルやデータセットのダウンロードが実際の計算より長く、ネットワークオーバーヘッドも大きいなら、計算は崩れます。データは単純なSmart Gridの比喩が示すより重いのです。

ここでINTELLECT-2が面白くなります。Prime Intellectは論文で、TOPLOCを信頼できない推論ワーカーのrolloutsを検証する構成要素として説明しています。これは突然すべてのCompute問題を解くものではありません。外部ハードウェア上の任意の企業データに対する魔法のプライバシーでもありません。しかし分散型AI作業の特定のクラスに対して、現実の仕組みを示しています。各ワーカーを盲目的に信頼するのではなく、結果が検証可能になるようジョブを作るのです。

機密データには、それだけでは足りません。そこには別の構成要素が必要です。Confidential Computing、Trusted Execution Environments、Remote Attestation、きれいなサンドボックス、明確なデータ分類、そして場合によっては、特定のジョブを外部ハードウェアで走らせないという厳しい判断です。さらに退屈ですが決定的な問いがあります。税金、責任、プライバシー、データ所在地、インターネットプロバイダーの規約。インフラは数学だけで失敗することはまれです。多くは運用で失敗します。

Compute Smart Grid

私は、素朴な「すべてがP2Pになればすべてうまくいく」というものを想像していません。インフラはそう動きません。機能し得るのは、明確な層を持つCompute Smart Gridです。

第一の層はローカル優先です。個人的、機密、レイテンシ重視のものは、できるだけ自分のデバイスか自分の信頼空間で動くべきです。小さなモデル、ローカル検索、プライベートな要約、簡単な分類、前処理、暗号化、個人データの埋め込み。すべてのメール、メモ、検索をハイパースケーラーへ送る必要はありません。

第二の層は地域的でフェデレートされたものです。都市、地区、キャンパス、企業、協同組合、プロバイダーがセルを運営できます。このセルではデバイスが自発的にリソースを提供しますが、明確な条件の下でのみです。電源につながっているときだけ、アイドルのときだけ、熱的制限の範囲内だけ、定義された最大電力までだけ、特定のジョブ種別だけ。

出発点はスマートフォンや車ではなく、もっと退屈なデバイスです。デスクトップGPU、ワークステーション、ゲーム機、小型サーバー、NASシステム、ローカルプロバイダーの余剰容量。スマートフォンは後で小さな検証ジョブを引き受けられるかもしれません。車はさらに後、非常に狭いメーカー管理下の制限でなら考えられます。電力網と同じように、まず信頼でき、測定でき、制御できるリソースから始める必要があります。

第三の層は中央のままです。フロンティア学習、厳しいリアルタイム性、極端に大きなモデル、規制上デリケートな特殊ケース、結合の強いワークロードは、プロのデータセンターに属します。分散化はすべてを置き換える必要はありません。日常のすべての仕事が自動的に同じ五つの権力中心を通ることを防げばよいのです。

試すなら、私は小さく始めます。何百万台ものiPhoneではなく、500から2'000の自発的なデスクトップGPU、ワークステーション、NASシステム、小型サーバーで構成される地域セルです。許可されるジョブ種別は少数だけ。非機密データの埋め込み、科学的なバッチジョブ、暗号化されたストレージ断片、検証タスク。成功はきれいなExaの数字ではなく、三つの退屈な指標で測ります。$1の電力コストあたりの完了ジョブ数、エラー率と再実行率、ハードウェア摩耗後の支払い。

最も難しい部分は報酬です。ユーザーは電力、熱、ハードウェア摩耗を負担します。だから何かを受け取る必要があります。おそらくトークンやクレジットは本当に必要です。ただし投機対象としてではなく、インフラの利用残高としてです。

そのようなCompute Creditは、何か実体のあるものを表すべきです。特定クラスのGPU分、GB-monthのストレージ、検証済み推論、バッチ埋め込み単位、kWh相当の計算単位。リソースを提供した人はクレジットを稼ぎます。後で自分がAI能力を必要とするとき、それを使います。使いたくない人は法定通貨で換金できる。Virtual Power Plantで「Powerwall Coins」ではなく、実際のお金か明確なクレジットを受け取りたいのと同じです。

それでも価格の問いが魔法のように解けるわけではありません。安定性にはアンカーが必要です。法定通貨での請求、エネルギー価格の範囲、地域の清算機関、協同組合型の料金、規制された運営者。ガバナンスなしでは「安定したクレジット」はすぐに自由変動トークンになります。そして古い問題に戻ります。インフラがカジノのように感じられるのです。

さらに重要なのは運用権です。すべての大きな基盤モデルを自分たちで学習する必要はありません。モデル、オープンな重み、モデルファミリーを購入またはライセンスし、それを分散型、フェデレート型、地域管理型で運用するのかもしれません。本当の主権は学習だけではなく運用にもあります。モデルはどこで動くのか。データはどこにあるのか。誰が監査できるのか。提供者へのバックチャネルはあるのか。政治、価格、規約が変わっても、モデルをローカルで動かし続けられるのか。

それがただのきれいな購入契約で終わらないためには、ライセンスに実質的な運用権が含まれていなければなりません。ローカル展開、長期的な更新とセキュリティのコミットメント、追跡可能なmodel cards、監査可能性、明確な退出権、そして機密データを中央のメーカーCloudへ戻す義務がないこと。これは純粋な分散ユートピアではありません。しかし素朴な自給自足と完全なプラットフォームロックインの間にある現実的な道です。

デバイスが計算する夜

想像してください。22:43です。GPUを積んだあなたのデスクトップはアイドル、NASはオンライン、スマートフォンは充電中。設定ではこう決めています。最大80 watts、アイドル時のみ、地域内の検証済みワークロードだけ、そして報酬が電力コストとハードウェア手当をカバーする場合だけ。

ローカルエージェントが空き容量を報告します。あなたの名前でもプライベートデータでもなく、特定の能力を持つ証明済みノードとしてです。セルは小さなジョブを配ります。シミュレーション、埋め込み、暗号化されたストレージ断片、検証タスク。

朝には、ロケットも、Wall Streetの物語も、ハイプトークンもありません。ただ冷静な一行だけです。

今夜: 2.4 GPU credits earned, 18 GB-months storage confirmed, $0.31 electricity costs estimated.

その後、あなたは自分の文書のためのローカルモデルにそのクレジットを使います。機密データはあなたの手元に残ります。あなたは顧客であるだけではありません。参加者でもあります。

これはロマンチックに聞こえます。そうです。でも時には、それこそが難しいエンジニアリング問題を真面目に受け止める理由になります。

群れと山

中央データセンターが消えるとは思いません。効率的で、重要で、あるタスクには単純に必要です。山は残ります。問いは、その隣にもう一度地面を作るかどうかです。

ローカルデバイス、地域セル、オープンプロトコル、安定したクレジット、明確なセキュリティモデルでできた地面。そこでは計算能力が上から下へ売られるだけでなく、参加者の間を流れます。そこでは特定のAI作業が、本来あるべき場所で動きます。プライベートな作業はローカルで、地域の作業は地域で、グローバルな例外ケースはデータセンターで。

もしかすると素朴かもしれません。そうではないかもしれません。Virtual Power Plantも、かつては奇妙なアイデアでした。何千もの小さなバッテリーを一つの大きなネットワークとして扱う。分散型のお金もしばらくは馬鹿げて聞こえました。自動運転タクシーとして走る車もSFでした。そのすべてが約束された形で来るわけではありません。しかし方向は明確です。以前は受動的に置かれていたリソースが、より大きなシステムの一部として考えられ始めています。

まさに今、未使用の機械があちこちにあります。住まい、オフィス、ガレージ、サーバールーム、ポケットの中に。どれも同じように適しているわけではありません。どれも外部の仕事を実行すべきとは限りません。しかし多くはすでにそこにあり、支払い済みで、ネットワークにつながっています。そして未使用の一秒は一つずつ消えていきます。

そろそろ、それらの声を聞き始めてもいいのかもしれません。

また次回まで,
Joe

参考資料