SaaS月30万→自社AI月5万の「次」が見えた。MCPサーバー×ローカルLLM×合成ツールで、業務システムの値段が壊れる
Related Articles

結論から言う。業務システムの「適正価格」が、もうすぐ2桁変わる
SaaS月額30万円。よくある話だ。
顧客管理、在庫管理、請求書処理——中小企業がまともに業務を回そうとすると、SaaSを3つ4つ重ねて月30万〜50万は飛んでいく。年間360万〜600万。従業員20人の会社にとって、これは人件費1人分に匹敵する。
それが「自社でAIを組めば月5万になる」というフェーズに入ったのが、ここ1〜2年の話だった。クラウドLLMのAPI費用と、ちょっとしたインフラ代。確かにコストは下がった。
だが、次に来る波はもっとえげつない。
月300万クラスの業務システムが、月5,000円以下で動く。
大げさに聞こえるだろう。でも3つの技術トレンドが同時に動いている今、この数字は絵空事ではなくなってきた。MCPサーバーのインクリメンタル更新、合成ツールによる開発スケーリング、そしてローカルLLMの実用域への到達。この3つが噛み合ったとき、業務システムの「値段」という概念そのものが壊れる。
順に見ていく。
—
1. MCPサーバーの差分更新——「API連携コスト」が消える
業務システムのコストの大部分は、実は「つなぎ込み」にかかっている。
会計ソフトとCRMをつなぐ。CRMと在庫管理をつなぐ。在庫管理とECサイトをつなぐ。このAPI連携の開発・保守が、SaaSベンダーが高い月額を取れる根拠になっている。自前で組もうとすれば、外部APIの仕様変更のたびにシステム全体をテストし直す必要があり、開発会社に頼めば1回あたり数十万〜数百万。だからSaaSに依存する。この構造が、中小企業のコストを押し上げてきた。
MCP(Model Context Protocol)は、LLMが外部ツールやAPIを呼び出すための標準プロトコルだ。要するに「AIが勝手にAPIを叩ける仕組み」。これ自体は2024年後半から話題になっていた。
注目すべきは、ここに「差分更新(インクリメンタルアップデート)」の仕組みが乗り始めたことだ。DeltaMCPと呼ばれるアプローチでは、外部APIの仕様が変わっても、MCPサーバー全体を再構築する必要がない。変更があった部分だけを差分で更新できる。
これが何を意味するか。
従来、API連携の保守に年間100万〜200万かかっていたコストが、ほぼゼロに近づく。APIの仕様書(OpenAPI Specなど)を食わせれば、MCPサーバーが自動的に差分を検知し、該当するツール定義だけを更新する。人間がやることは「新しいAPI仕様書を置く」だけ。
保守コストが消えるということは、「SaaSベンダーに月額を払い続ける理由」の一つが消えるということだ。
—
2. 合成ツール——「開発工数」が10分の1になる
業務システムを自前で作る最大のハードルは、開発工数だ。要件定義、設計、実装、テスト。中小企業が外注すれば300万〜1,000万は覚悟しなければならない。
ここに風穴を開けるのが、合成ツール(Synthetic Tools)のフレームワークだ。SynthToolsに代表されるこのアプローチは、LLMを使って「業務環境そのもの」をシミュレーションし、その上でタスクを定義・検証する。
具体的に言うとこうだ。
- 環境生成: 「うちは従業員15人の製造業で、受注→製造→出荷→請求のフローがある」と記述すると、LLMがその業務環境をシミュレーション用に自動生成する
- ツール合成: その環境に必要なツール(受注登録、在庫チェック、請求書発行など)をLLMが自動で定義・実装する
- タスク検証: 実際の業務シナリオを流して、ツールが正しく動くかを自動テストする
従来なら要件定義だけで2週間、実装に1〜2ヶ月かかっていた工程が、数時間〜数日で回る。しかも、実際のAPIの複雑さに煩わされない。合成環境でまず動くものを作り、検証が通ったら本番APIにつなぎ替える。この「まず動くものを爆速で作る」プロセスが、開発コストを根本から変える。
開発期間が2ヶ月から3日になったら、外注費300万円は何になるか。自社のスタッフがLLMに指示を出す人件費——せいぜい数万円だ。
—
3. ローカルLLM——「ランニングコスト」が電気代だけになる
「でもLLMのAPI費用がかかるでしょ?」
その通りだった。GPT-4クラスのAPIを業務システムで常時回せば、月数万〜十数万は飛ぶ。これが「自社AI月5万」の内訳の大部分だった。
だが、ローカルLLMの性能が急速に実用域に入ってきている。
2025年現在、Llama 3.1やQwen 2.5、Phi-4クラスのモデルが、8B〜70Bパラメータで業務レベルのタスクをこなせるようになった。量子化技術の進歩で、70Bモデルですら消費者向けGPU(RTX 4090やRTX 5090)で動く。vLLMやllama.cppなどの推論エンジンの最適化で、レスポンスも実用的な速度に達している。
ハードウェアコストを計算してみよう。
- RTX 4090搭載の推論用PC: 約40〜50万円(中古なら30万円台)
- 電気代: 月2,000〜3,000円
- 保守: ほぼゼロ(壊れたらパーツ交換)
イニシャル50万、ランニング月3,000円。3年使えば月あたりの総コストは約1.7万円。5年使えば月1.1万円。API費用はゼロ。データは社外に出ない。
SaaSに月30万払っていた会社が、月5,000円以下で同等以上のシステムを動かせる計算になる。
—
3つが噛み合うと何が起きるか
ここからが本題だ。この3つは個別に見ても面白いが、組み合わさったときに構造的な変化が起きる。
ローカルLLMがランニングコストをほぼゼロにし、
合成ツールが開発コストを10分の1以下にし、
MCPサーバーの差分更新が保守コストをほぼゼロにする。
業務システムのコスト構造は「開発費 + 運用費 + 保守費」だ。この3つが同時に桁違いに下がる。
従来: 開発300万 + 運用月30万 + 保守年100万 = 初年度660万、2年目以降460万/年
これからの構造: 開発5万(自社スタッフ数日)+ 運用月5,000円(電気代)+ 保守ほぼゼロ = 初年度11万、2年目以降6万/年
年間460万が6万になる。 約77分の1。
もちろん、これは理想的なケースだ。実際にはLLMの精度調整や業務固有のカスタマイズに時間がかかる。だが、桁が2つ変わる方向に向かっているのは間違いない。
—
中小企業にとって、これは「逆転の構造」になる
ここで考えてほしい。
大企業は、すでにSaaSベンダーと年間契約を結び、カスタマイズに数千万を投じ、専任のIT部門が保守している。この「重い構造」は、コストが劇的に下がる局面ではむしろ足かせになる。契約の縛り、既存システムとの互換性、社内調整——大企業ほど動きが遅い。
一方、中小企業は身軽だ。
既存システムがショボい? むしろチャンスだ。捨てるものが少ないほうが、新しい構造に乗り換えやすい。IT部門がない? LLMに指示を出せる人が1人いれば足りる時代が来ている。
「ITに投資できないから負けていた」構造が、「ITにコストがかからないから同じ土俵に立てる」構造に変わる。
これは、かつてクラウドが「サーバーを持てない中小企業」を救ったのと同じ構造だ。ただし、今回のインパクトはもっと大きい。クラウドは「インフラのコスト」を下げた。今回は「システムそのもののコスト」が消える。
—
で、今日から何をすればいいのか
3つ、やることがある。
1. 自社の「SaaS月額」を棚卸しする
今、月にいくら払っているか。何のSaaSに、いくら。これを一覧にするだけで、「この金額、本当に必要か?」という問いが生まれる。多くの中小企業は、惰性で払い続けている月額がある。
2. ローカルLLMを1台、触ってみる
中古のゲーミングPCにOllamaを入れて、Llama 3.1の8Bモデルを動かす。所要時間30分、コスト5万円以下。「こんなことがローカルでできるのか」という体感を得ることが、すべてのスタート地点になる。
3. MCPサーバーを1つ、立ててみる
Claude DesktopやCursorなど、MCP対応のツールはすでにある。自社で使っているサービスのAPIをMCPサーバー経由でLLMにつないでみる。「AIが勝手にデータを取ってきて、勝手に処理する」体験をすると、SaaSの管理画面をポチポチする作業がいかに無駄だったか気づく。
どれも、今日始められる。コストは数万円。失敗しても痛くない。
—
最後に
「300万が5,000円」は、今日の話ではない。だが、3年後の話でもない。
要素技術はすでに揃い始めている。足りないのは「組み合わせて実際に動かした事例」だけだ。そして、その事例を最初に作るのは、大企業ではなく、身軽な中小企業のはずだ。
待っていても誰も教えてくれない。まず触れ。まず動かせ。コストが壊れる側にいるか、壊される側にいるか。その分岐点は、もう目の前にある。
—
JA
EN