ブラウザでLLMが動き、Raspberry PiがAIを獲得し、325行でニュースが要約される——「AIサーバー不要時代」の月額コストを計算した
Related Articles

月額500円 vs 月額数万円。AIの「動かし方」で、コスト構造がひっくり返る
AIを使うのに、もうサーバーはいらないかもしれない。
ブラウザだけでLLMが動く「WebLLM」。1万円以下のRaspberry Pi 5にAI推論チップを載せる「AI HAT+」。そして、たった325行のPythonコードでニュース要約を自動化するプロジェクト。
この3つを並べて見えてくるのは、「AIを使うコストの桁が変わる」という事実だ。クラウドAPIに毎月数万円払っていた処理が、電気代500円で回る世界が、もう始まっている。
中小企業にとって、これは「面白い技術ニュース」ではない。経営判断の話だ。
—
WebLLM——ブラウザがAIサーバーになる
WebLLMは、ブラウザ内でLLM(大規模言語モデル)の推論を実行するオープンソースエンジンだ。WebGPUを使い、ユーザーの手元のGPUで直接モデルを動かす。
つまり、APIキーもサーバーも不要。ブラウザを開くだけで、チャットAIが動く。
何が変わるか?
- API利用料がゼロになる。 OpenAIやClaudeのAPIに1リクエストごとに課金される構造から解放される
- データが外に出ない。 顧客情報や社内文書をクラウドに送る必要がない。地方の中小企業が最も気にする「うちのデータ、大丈夫?」問題が消える
- ネット回線が細くても動く。 モデルの初回ダウンロード(数GB)さえ済めば、あとはオフラインでも推論できる
もちろん制約はある。ブラウザで動かせるモデルサイズには限界がある。GPT-4クラスの性能は出ない。現時点で実用的に動くのはLlama 3 8BやPhi-3クラスで、パラメータ数でいえば数十億規模だ。
だが、考えてほしい。社内の問い合わせ対応、定型文の生成、議事録の要約——こういった業務に、GPT-4は必要か? 8Bモデルで十分な業務は、実は山ほどある。
「最高性能のモデルを使うこと」と「業務に必要十分なモデルを使うこと」は、まったく別の話だ。中小企業が勝つのは、後者の判断ができたときだ。
—
Raspberry Pi 5 + AI HAT+——1万円で「自社AIサーバー」が立つ
Raspberry Pi 5は、もともと約1万円前後の小型コンピュータだ。ここにHailo製のAIアクセラレータを搭載した拡張ボード「AI HAT+」(約1万円前後)を載せると、最大26TOPS(毎秒26兆回の演算)のAI推論性能を手に入れる。
初期投資の現実的な内訳はこうなる。
| 項目 | 価格(税込目安) |
|---|---|
| Raspberry Pi 5(8GB) | 約12,000円 |
| AI HAT+(Hailo-8L搭載) | 約10,000円 |
| microSD・電源・ケース等 | 約3,000円 |
| 合計 | 約25,000円 |
月額の運用コストは、ほぼ電気代だけだ。Raspberry Pi 5の消費電力は最大27W。AI HAT+を含めても30W前後。24時間稼働させても月間の電気代は約700円(1kWh=32円で計算)。
この構成で何ができるか。
- 画像認識による検品自動化。 製造ラインのカメラ映像をリアルタイムで解析し、不良品を検出
- 来客カウント・動線分析。 店舗のカメラ映像から人数や滞留時間を自動集計
- 音声のリアルタイム文字起こし。 会議や電話対応の記録を自動化
重要なのは、これがすべてインターネット接続なしで動くという点だ。工場の製造ラインや、回線が不安定な地方の店舗でも、エッジで完結する。
クラウドの画像認識API(AWS RekognitionやGoogle Vision AI)を使えば、1,000枚あたり数百円〜数千円のコストが継続的にかかる。月に10万枚処理する工場なら、API代だけで月数万円だ。Raspberry Piなら、初期費用2.5万円と月700円の電気代。半年で元が取れる計算になる。
—
325行のPythonコード——「情報収集」の属人化が終わる
3つ目の事例は、325行のPythonコードで動くAIニュース要約ツールだ。
仕組みはシンプルだ。RSSフィードやニュースサイトから記事を自動収集し、ローカルLLM(またはAPIを最小限だけ使う構成)で要約を生成する。毎朝、自分の業界に関連するニュースが要約済みで届く。
325行。これがどれくらいの規模感かというと、Excelのマクロを少し書ける人なら読める量だ。特別なAIエンジニアは要らない。
中小企業の現場で、これが刺さる理由がある。
多くの会社で「業界ニュースのチェック」は特定の誰かに属人化している。社長が毎朝30分かけて日経を読む。営業部長がXで情報を拾う。その人が休んだら、情報が止まる。
325行のスクリプトは、この属人化を壊す。毎朝、決まった時間に、決まったソースから、決まったフォーマットで、要約が届く。 人に依存しない。再現可能。仕組み化の本質だ。
コストはどうか。ローカルLLMで完結させるなら、前述のRaspberry Pi構成で月700円。クラウドAPIを使う構成でも、1日50本のニュース要約なら月間1,500本。GPT-4o miniのAPI料金で計算すると、月額100〜300円程度で収まる。
社長の朝30分を時給換算してみてほしい。仮に年収1,000万円の社長なら、時給は約5,000円。30分で2,500円。月20営業日で5万円。月5万円の作業を、月300円で自動化できる。 これが「コストの桁が変わる」ということだ。
—
月額コスト比較——「クラウド従量課金」vs「ゼロインフラAI」
3つの技術を踏まえて、従業員30人規模の中小企業を想定し、月額コストを比較する。
パターンA:クラウドAPI依存型
| 項目 | 月額コスト |
|---|---|
| LLM API利用料(社内チャット・要約等) | 約15,000〜30,000円 |
| 画像認識API(検品・分析等、月5万枚) | 約5,000〜15,000円 |
| クラウドストレージ・転送料 | 約2,000〜5,000円 |
| 合計 | 約22,000〜50,000円/月 |
※利用量に比例して増加。繁忙期にはさらに跳ねる。
パターンB:ゼロインフラAI型
| 項目 | コスト |
|---|---|
| Raspberry Pi 5 + AI HAT+(初期) | 約25,000円 |
| WebLLM用PC(既存PCを流用) | 0円 |
| 月間電気代 | 約700円 |
| ニュース要約API(最小利用) | 約300円 |
| 月額合計 | 約1,000円/月 |
※初期投資2.5万円は3ヶ月で回収可能。
月額5万円が月額1,000円になる。 50分の1だ。年間で約60万円の差。従業員30人の中小企業にとって、60万円は忘年会の予算ではなく、新しい人を1ヶ月雇える金額だ。
—
ただし、万能ではない。使い分けの判断基準
誤解のないように書いておく。ゼロインフラAIは万能ではない。
- 高度な推論が必要な業務(契約書の法的レビュー、複雑なデータ分析)→ クラウドの大規模モデルが必要
- 大量のデータを横断的に学習させたい場合 → ローカルでは計算資源が足りない
- リアルタイム性と精度の両方が求められる場合 → エッジだけでは限界がある
判断基準はシンプルだ。「この業務に、GPT-4クラスの性能は本当に必要か?」と問うこと。答えがNoなら、ゼロインフラで十分だ。そして、中小企業の日常業務の8割は、Noだと思っている。
—
で、結局どうすればいいのか
3つのステップを提案する。
1. まず325行のニュース要約から始める。 投資ゼロ。既存のPCとPythonだけで動く。「AIで業務が変わる」という体験を、まず社内で1人が持つ。これが起点になる。
2. WebLLMを社内で試す。 ブラウザを開くだけ。社内FAQ対応や定型メール作成など、「毎日やってるけど頭を使わない作業」をAIに渡してみる。データが外に出ないから、情シスの承認も通りやすい。
3. 効果が見えたら、Raspberry Piでエッジを固める。 画像認識や音声処理など、常時稼働が必要な業務をエッジに載せる。2.5万円の投資で、クラウド課金から解放される。
いきなり全部やる必要はない。小さく始めて、コスト削減の実績を数字で出す。 その数字が、次の投資の根拠になる。
AIの民主化という言葉は使い古されたが、本当に起きていることは「AIの価格崩壊」だ。サーバー代が消え、API代が消え、残るのは電気代だけ。この構造変化に気づいた中小企業から、勝手に強くなっていく。 大企業の稟議が通るのを待っている間に、動いた者が勝つ時代だ。
—
JA
EN