Google×ブラックストーン7,000億円、NVIDIA 4ビット学習——巨人の殴り合いで「API単価半額」はいつ来るか。中小企業は待つな、今の単価で元が取れる業務から始めろ
Related Articles

結論から言う。API単価は確実に下がる。だが「下がってから動く」では遅い
2025年6月、AIインフラを巡る巨人たちの殴り合いが一段と激しくなった。Googleと投資ファンド最大手ブラックストーンが約50億ドル(約7,000億円)を投じてAIクラウド新会社を設立。同じ週にNVIDIAは、学習コストを理論上半分にできる「4ビット学習」技術の成果を発表した。
この2つのニュースを並べると、見えてくる構造は1つ。「AIを使うコスト」は、上流の投資競争と技術革新の両面から、不可逆的に下がり続けるということだ。
問題は「いつ」「いくら」下がるか。そして中小企業は今どうすべきか。ここを曖昧にしたまま「注視しましょう」で終わる記事は山ほどある。この記事では、具体的な数字と構造で踏み込む。
—
Google×ブラックストーン新会社の本質——「供給過剰」を意図的に作る構造
まず、この新会社が何をやろうとしているのか整理する。
Googleはすでに自社クラウド(Google Cloud)を持っている。にもかかわらず、わざわざブラックストーンという外部の巨大資本を引き入れて別会社を作る。なぜか。
理由はシンプルだ。自社バランスシートを使わずに、データセンターの物理的な拡張スピードを上げたいからだ。ブラックストーンは不動産・インフラ投資のプロ。土地の確保、建設、電力契約——こうした「物理レイヤー」の調達を加速できる。
Googleが持ち込むのは、自社開発のTPU(Tensor Processing Unit)を中心としたAI専用チップと、その上で動くソフトウェアスタック。つまり、NVIDIAのGPUに依存しないAIインフラを大量に市場に投入するという宣言だ。
これはMicrosoft×OpenAI連合、Amazon AWS、そしてNVIDIA GPU陣営に対する真正面からの価格競争の号砲でもある。
供給が増えれば価格は下がる。経済の原則通りだ。ここで重要なのは7,000億円という数字の意味。これは「ちょっとやってみる」規模ではない。回収するには大量の顧客にサービスを売る必要がある。つまり、単価を下げてでもシェアを取りに行くフェーズに入ったということだ。
—
NVIDIAの4ビット学習——「学習コスト半減」は誇張ではない
次にNVIDIAの4ビット学習。これは技術的にはかなりインパクトが大きい。
従来、AIモデルの学習にはFP16(16ビット浮動小数点)やBF16が主流で、最近はFP8(8ビット)への移行が進んでいた。NVIDIAが今回発表したのは、さらにその半分の4ビットでの学習だ。
具体的な成果として公表されているのは以下の通り。
- 12BパラメータのハイブリッドMamba-Transformerモデル
- 10兆トークンでの事前学習
- FP8基準とほぼ同等の精度を達成
ビット数が半分になるということは、単純計算でメモリ使用量が半分、演算効率が最大2倍になる。学習に必要なGPU時間が半分になれば、クラウドの利用料金も半分に近づく。
もちろん、すべてのモデルで同じ結果が出るわけではないし、量産環境での安定性はこれから検証が進む。だが方向性は明確だ。同じ性能のモデルを、半分のコストで作れる時代が近づいている。
ここで考えるべきは「学習コストが下がると何が起きるか」だ。
答えは、APIを提供する側の原価が下がる。原価が下がれば、競争環境下では販売価格(=API単価)も下がる。Google×ブラックストーンの供給拡大と、NVIDIAの効率化技術。この2つが同時に進行している。API単価が下がらない理由を探す方が難しい。
—
API単価はどこまで下がるか——過去の実績から読む
「下がるのはわかった。で、いくら下がるの?」
ここが一番知りたいところだろう。過去の実績を見てみる。
OpenAIのGPT-4レベルのAPI単価の推移はこうだ。
- 2023年3月(GPT-4リリース時):入力100万トークンあたり約30ドル
- 2024年5月(GPT-4o):同 約5ドル
- 2025年現在(GPT-4o最新):同 約2.5ドル
2年で約12分の1。年率で見ると、毎年おおよそ70〜80%下落している計算になる。
このペースが続くと仮定すれば、2026年半ばには現在の3分の1〜5分の1になっていてもおかしくない。100万トークンあたり0.5〜1ドルの世界だ。日本円にすれば70〜150円。
今、中小企業がChatGPT APIを業務に使って月に数千円〜数万円かかっているとしたら、1年後にはその3分の1以下になる可能性が高い。
ただし注意点がある。最先端モデル(GPT-5やGemini 2.0 Ultraクラス)は、リリース直後は高い。下がるのは「1〜2世代前のモデル」からだ。つまり、今のGPT-4oクラスの性能が「激安」で使えるようになる、という構造。中小企業の業務用途なら、最先端モデルは不要なケースがほとんどだ。これは朗報でしかない。
—
中小企業は「待つべきか、今動くべきか」——答えは明確だ
「もっと安くなるなら待った方がいいのでは?」
この問いに対する答えは、はっきりしている。待つな。
理由は3つある。
1. 今のAPI単価でも、人件費と比べれば圧倒的に安い
例えば、社内の問い合わせ対応。パート社員が月20時間かけて対応しているとする。時給1,200円で月24,000円。これをAIチャットボットに置き換えた場合、API費用は月2,000〜5,000円程度で済む。今の単価でも5分の1以下だ。
単価が半分になったところで、2,500円が1,250円になるだけ。差額1,250円のために半年待つ意味があるか? その半年間に失う24,000円×6ヶ月=144,000円の方がはるかに大きい。
2. コストより「慣れ」の方が価値が高い
AIを業務に組み込むには、プロンプトの調整、業務フローの見直し、社員の慣れ——これらに時間がかかる。この「学習期間」は、単価がいくら下がっても短縮できない。
今から始めた会社と、1年後に始めた会社では、1年分の運用ノウハウの差がつく。中小企業にとって、この差は大企業以上に致命的だ。なぜなら、中小企業は「少人数で回す」のが前提だから。1人が使いこなせるかどうかで、組織全体の生産性が変わる。
3. 「安くなったら始める」会社は、安くなっても始めない
身もふたもないが、これが現実だ。「もう少し待てば」と言い続けて3年経った会社を何社も見てきた。テクノロジーの価格は常に下がり続ける。「十分に安くなった」と感じるタイミングは永遠に来ない。
—
じゃあ具体的に何から始めるか
「今動け」と言われても、何をすればいいかわからない。そういう声が聞こえてくる。
シンプルなフレームワークを1つ提示する。
「月に10時間以上、人がやっている定型的な作業」をリストアップしろ。
- 見積書の作成補助
- 社内マニュアルの検索・回答
- 日報・報告書の要約
- メールの下書き
- 採用応募者への一次返信
こういった業務は、今のAPI単価でも月数千円で自動化・半自動化できる。完璧じゃなくていい。人がやっていた作業の7割をAIがやり、残り3割を人がチェックする。これだけで、担当者の時間が大幅に空く。
空いた時間で何をするか。営業に回す、顧客対応を厚くする、新しい商品を考える。コスト削減ではなく「時間の再配分」として捉えるのが、中小企業のAI活用の本質だ。
—
まとめ——巨人の殴り合いを、中小企業の追い風に変える
Google×ブラックストーンの7,000億円投資。NVIDIAの4ビット学習。これらは大企業同士のインフラ競争だ。中小企業が直接関わる話ではない。
だが、この競争の結果としてAPIの単価は確実に下がる。過去2年で12分の1になった実績がある。今後1年でさらに3分の1〜5分の1になる可能性は十分にある。
しかし、繰り返す。待つな。
今の単価でも、人件費と比べれば圧倒的に安い。そして「慣れ」という、金では買えない資産は、早く始めた者だけが手に入れられる。
巨人たちが殴り合って単価を下げてくれている間に、中小企業がやるべきことは1つ。今日、1つだけ業務を選んで、AIに任せてみることだ。月2,000円の実験で、半年後の働き方が変わる。
インフラの殴り合いは、見物するものじゃない。その恩恵を、最速で拾いに行くものだ。
—
JA
EN