効率よく「分け合える」ようにする仲介ソフトウェア
「Broker(ブローカー)」は売り手と買い手の間を仲介する存在。 不動産仲介会社や株式ブローカーと同じ役割をコンピューティングリソースの世界で担う。
AI処理の需要は爆発的に増えているが、GPUは高価で希少。 ACBは「誰がいつGPUを使うか」を自動で調整し、 1台のGPUで複数のAIアプリを効率よく動かす。
富士通が2024年10月に商用製品として最初に体系化・提供開始。 SoftBank・Nokia・Akamaiも独自に同等機能を実装・展開している。
ChatGPT以降、AI推論・学習のGPU需要は急増。 NVIDIA製GPUは1台数百万〜数千万円と高価なうえ、 供給不足が続いている。
従来は「1アプリに1GPU」を割り当てていたが、 アプリがGPUを常時フル稼働させているわけではないため、 多くの時間でGPUがアイドル状態になっていた。
ACBはこの「GPU使用率の低さ」を解消し、 同じハードウェアでより多くのAIを動かす技術。 GPU投資効率を最大化する「GPU経営」の中核ツール。
- AIアプリAが推論処理中 → GPU占有
- AIアプリBはGPU待ち → 処理が止まる
- AI処理の合間でGPUが遊んでいる時間が多い
- 「1アプリ1GPU」で台数が増えコスト増大
- テレコムの場合:RANとAIが別々のハードウェア必要
- GPU不足で新しいAIサービスを出せない
- AIアプリAがGPUを使わない瞬間に → 即座にBへ割当
- 複数アプリが1つのGPUを時間的に共有
- GPUのアイドル時間がほぼゼロに
- 同じGPU台数でより多くのAIを稼働
- テレコムの場合:RANとAIが1台のGPUで共存
- GPU投資効率が最大2.25倍向上
アプリ
処理
解析
異常検知
AI Computing Broker
動的リソース配分エンジン
GH200
GPU
GPU
⚡ アダプティブGPUアロケーター
AIアプリの動作をリアルタイム監視し、 GPU演算が実際に必要な瞬間だけGPUを割り当て、 不要になったら即座に解放して別のアプリへ渡す。 静的分割ではなく時間軸での動的共有(Temporal Sharing)を採用。
💾 フルメモリアクセス技術
通常、複数アプリでGPUを共有するとメモリが分割される。 ACBの独自技術により、各アプリが GPUメモリ全体を専有しているかのようにアクセスできる。 大規模LLMも含む多様なワークロードが同一GPUに共存できる。
🧠 GPU Assigner(スケジューラー)
バックフィリング(大きなジョブが待機中に小さなジョブが空きリソースを活用) 等のポリシーを適用し、GPU稼働率を最大化。 PyTorchベースのアプリならコード変更ゼロで適用可能。 Docker・Slurm等とも統合できる。
AITRASは「AIとRANを同一GPUで動かす技術」だが、その核心は 「どちらにどれだけGPUを割り当てるか」を瞬時に判断する「オーケストレーター」にある。 このオーケストレーターは、まさにACBのテレコム特化版として機能する。
| 比較軸 | AITRAS(SoftBank) | 汎用ACB(富士通等) |
|---|---|---|
| ブローキング対象 | RAN処理 ↔ AI推論 | 複数AI推論アプリ間 |
| ハードウェア | NVIDIA GH200(特定) | NVIDIA GPU全般・クラウド |
| 用途 | 5G基地局 + エッジAI | データセンター・HPC・AI推論 |
| オープン化 | DSFオープンソース化済み | 製品提供(一部OSSあり) |
| 外部連携 | Nokia AI-RANとも連携対応 | クラウド・オンプレ統合 |
| 主な展開形態 | 通信キャリアのエッジ基地局 | データセンター・企業内GPU |
SoftBankは「データを運ぶネットワーク」から「AIを動かすコンピューティング基盤」への転換を宣言しており、 AITRASのACB機能(オーケストレーター)がその中核を担う。
公式発表では「AI-RAN型のMEC(モバイルエッジコンピューティング)を通じて、 分散エッジ全体にわたるAIワークロードのオーケストレーションとブローキングを実現し、 必要な場所にリアルタイムでAI推論を届ける」と明言。 2026年10月にはInfrinia AI Cloud OSとして商用サービス開始予定。
2024年10月にACBを商用製品として正式発売。 最もACBを体系的に定義・製品化したベンダー。 GPU使用量50%削減・処理効率2.25倍向上の実績あり。 PyTorchアプリにコード変更ゼロで適用可能。
AITRASオーケストレーターとしてテレコム特化のACB機能を実装。 Dynamic Scoring Framework(DSF)をオープンソース化。 NokiaのAI-RAN外部コンピュートエンジンとも連携済み。 2026年10月にInfrinia AI Cloud OSとして商用展開予定。
AI GridリファレンスデザインでACBの基盤技術を提供。 GH200 Grace Hopper SuperchipがAIとRAN処理の同時実行を可能にするハードウェア基盤。 Akamai・SoftBankとのパートナーシップで分散エッジへの展開を推進。
NVIDIAと共同で「AI Grid」を展開。 世界4,400拠点のエッジロケーションでAI推論リクエストをリアルタイムにブローキング。 超低遅延×大規模分散でのACBを実現。
AI-RAN External Compute Engine を提供。 複数の通信事業者のコンピューティングリソースをまとめてブローキングする機能を持つ。 AITRASオーケストレーターとのインターワーキング連携も対応済み。
GPUaaS(GPU-as-a-Service)の一環として、 自社ネットワーク上でACB的なGPU提供サービスを展開中。 通信事業者がAIコンピューティングの「ブローカー」として 新たなビジネスモデルを構築している事例。
痛み「5G基地局の整備コストが高い。AIサービスを提供したいが、基地局とは別にAIサーバーを設置するとコストが2倍になる」
提案SoftBankのAITRAStechnology(テレコム特化ACB)を採用することで、 5G基地局のGPUをRAN処理とAI推論で共用できる。 AIサーバーを別途設置する必要がなくなり、設備コストと消費電力を大幅削減しながら エッジAIサービスを提供できる。
痛み「AIサービスを複数展開しているが、それぞれにGPUを割り当てているためコストが膨らんでいる。GPUが余っている時間帯がある一方で、ピーク時には足りない」
提案富士通ACBを導入することでGPUを複数アプリで動的に共用できる。 先行事例では同じ処理量をGPU台数50%削減で実現。 初期投資を抑えながらAIサービスの規模を拡大できる。
痛み「通信事業者として回線事業の収益が伸び悩んでいる。新たな収益源を探しているが、AI領域への参入方法がわからない」
提案全国に展開する基地局インフラにACBを組み込み、 余剰GPUリソースをGPUaaS(GPU-as-a-Service)として企業に提供するビジネスモデルを構築。 SoftBank・Singtel・Verizonが先行して同モデルを展開中。 「通信事業者からAIコンピューティングプロバイダー」への転換を支援できる。