290MBのAIがブラウザで動き、腕時計にAIが載る——「AIの置き場所」が変わると、中小企業のコスト構造がひっくり返る
Related Articles

AIの「置き場所」が変わった。で、何が起きるのか?
AIを使うのに、月額数万円のAPI料金を払い、クラウドにデータを送り、レスポンスを待つ。それが当たり前だった時代が、終わりつつある。
290MBのAIモデルがブラウザだけで動く。カシオの腕時計にAIが入る。GoogleのGemma 4がiPhoneでオフライン推論する。
この3つのニュースに共通するのは、「AIがクラウドから降りてきた」ということだ。そしてこれは、大企業より中小企業にとってこそ意味がある構造変化だ。
290MBのAIがブラウザで動く——何が変わるのか
Bonsaiという1.7Bパラメータのモデルが、わずか290MBのサイズでブラウザ上で動作する。WebGPUを使い、ローカルのGPUリソースだけでリアルタイム推論を実行する。
数字で整理しよう。
- モデルサイズ:290MB。スマホの写真数十枚分。USBメモリにも余裕で入る
- 必要なインフラ:ブラウザだけ。サーバー不要、API契約不要
- ランニングコスト:ゼロ。クラウドに1リクエストも飛ばさない
これまで中小企業がAIを業務に組み込もうとすると、何が起きていたか。ChatGPTのAPI利用で月額3〜10万円。独自モデルをクラウドで動かせば月額数十万円。加えて、データをクラウドに送ることへの抵抗感。「うちの顧客データを外に出していいのか」という社長の一言で、プロジェクトが止まる。
290MBのブラウザAIは、この構造を根本から変える。データは一切外に出ない。月額コストはゼロ。ブラウザが開ける端末なら何でも動く。
もちろん、1.7Bモデルの性能はGPT-4oには遠く及ばない。複雑な推論や長文生成には向かない。だが、考えてみてほしい。中小企業の現場でAIに求められるタスクの大半は何か。
- 問い合わせメールの分類と下書き
- 日報や報告書の要約
- 定型的な文章の生成
- 簡単なデータの抽出と整理
これらの「80%のタスク」は、1.7Bクラスのモデルで十分にこなせる。GPT-4oが必要なのは残り20%だけだ。つまり、日常業務の8割を月額ゼロ円でAI化できる可能性が出てきた。
カシオF91Wに音声AI——2,000円の腕時計が「端末」になる
カシオF91W。定価2,000円前後で買える、世界で最も売れた腕時計の一つ。そのF91Wに、あるエンジニアが音声AIを搭載した。
nRF52840チップを組み込み、OpenAIのWhisper(音声認識モデル)とBLE(Bluetooth Low Energy)を組み合わせて、腕時計上で音声認識を実現している。
ここで注目すべきは技術的な凄さではない。「AIが動く場所の概念が壊れた」という事実だ。
これまでAIデバイスといえば、高性能なスマートフォンか、数十万円のワークステーションが前提だった。それが2,000円の腕時計で動く。チップ1個で動く。
この延長線上にあるのは何か。工場の作業員が腕時計に「今日の生産指示」と話しかけたら、スケジュールが返ってくる。建設現場で手が塞がっている職人が、腕元に「次の工程」と聞けば音声で教えてくれる。
中小企業の現場は、パソコンの前に座っていない人のほうが多い。工場、倉庫、店舗、建設現場。「パソコンを開かなくてもAIが使える」というのは、デスクワーカー中心の大企業より、現場仕事が多い中小企業にこそ刺さる。
しかも、デバイスコストが圧倒的に安い。スマートウォッチを全社員に配ると1台3〜5万円で数十万円の出費だが、F91Wクラスのデバイスなら桁が違う。
Gemma 4のオフライン推論——「通信できない場所」にAIが届く
Googleが公開したGemma 4は、iPhone上でオフライン推論が可能だ。クラウドに接続しなくても、端末内でAIが完結する。
これが効くのは、通信環境が不安定な場所だ。地方の山間部にある工場。地下にある倉庫。海上の船舶。通信が弱い、あるいはそもそも繋がらない場所は、日本中にある。
クラウドAIは、通信が切れた瞬間にただのアプリになる。オフラインAIは、通信環境に関係なく動き続ける。
さらに重要なのが、データの主権の問題だ。
中小企業の経営者が最も気にするのは、「うちのデータが外に出るのか」ということ。顧客リスト、取引先情報、見積もり金額。これらをクラウドに送ることに抵抗がある経営者は、体感で7〜8割はいる。
オフライン推論なら、データは端末から一歩も出ない。この「安心感」は、技術スペック以上に導入の決め手になる。
構造変化の本質——「AIのコスト構造」がひっくり返る
3つのニュースを並べると、一つの構造変化が見えてくる。
| 項目 | クラウドAI(従来) | エッジAI(これから) |
|---|---|---|
| 初期コスト | 低い(API契約だけ) | やや必要(端末・モデル構築) |
| ランニングコスト | 月額数万〜数十万円 | ほぼゼロ |
| データの所在 | クラウド(他社サーバー) | 手元(自社端末) |
| 通信依存 | 完全に依存 | 不要 |
| スケール | 使うほど高くなる | 使っても変わらない |
注目すべきは「スケール」の行だ。クラウドAIは、使えば使うほどAPI料金が膨らむ。社員10人が毎日100回使えば、月額コストは跳ね上がる。
エッジAIは違う。一度モデルを端末に入れたら、何回使ってもコストは変わらない。「使い放題」が前提のコスト構造になる。
これは中小企業にとって決定的に重要だ。大企業は月額100万円のAPI費用を経費として処理できる。中小企業にはそれができない。だが、ランニングコストがゼロなら話は別だ。
「で、結局どうすればいいのか」
今日からできることを3つ挙げる。
1. まず290MBモデルをブラウザで試す
Bonsaiのようなブラウザ動作モデルを、社内の定型業務に当てはめてみる。メール分類、日報要約、FAQ応答。「これ、クラウドに送らなくてもいけるな」と思えるタスクが必ず見つかる。
2. 「パソコンの前にいない社員」のAI活用を考える
現場仕事の社員がAIを使うには、スマホかウェアラブルが必要になる。音声入力+小型デバイスの組み合わせを、まず1チームで実験する。コストは数万円で済む。
3. 「データを外に出さないAI」を経営者に提案する
AI導入の最大の壁は、技術ではなく経営者の不安だ。「データは一切外に出ません。全部この端末の中で完結します」——この一言が、稟議を通す最強のフレーズになる。
AIは「使う場所」で勝負が決まる時代へ
クラウドAIの時代は、資金力がある企業が有利だった。高いAPI料金を払える企業が、より多くのAIを使えた。
エッジAIの時代は、構造が逆転する。ランニングコストがゼロに近づくなら、勝負を分けるのは「どこで、誰が、何に使うか」というアイデアだ。
290MBのモデルをブラウザに載せて、現場の問い合わせ対応を自動化する。腕時計型デバイスで、手が塞がった作業員にAIを届ける。オフラインで動くモデルを、通信が届かない現場に持ち込む。
これは全部、大企業より中小企業のほうが速く動ける領域だ。意思決定が速い。現場との距離が近い。「まず1人で試す」ができる。
AIの「置き場所」が変わるというのは、単なる技術トレンドの話ではない。「誰がAIの恩恵を受けるか」のゲームのルールが変わるということだ。
クラウドに月額料金を払い続けるのか、手元のデバイスでゼロ円で動かすのか。この選択を、今のうちに考えておいたほうがいい。
—
JA
EN