ブラウザでLLMが動き、Raspberry PiがAIを獲得し、325行でニュースが要約される——「AIサーバー不要時代」の月額コストを計算した

月額500円 vs 月額数万円。AIの「動かし方」で、コスト構造がひっくり返る AIを使うのに、もうサーバーはいらないかもしれない。 ブラウザだけでLLMが動く「WebLLM」。1万円以下のRaspberry Pi 5にAI推論チップを

By Kai

|

Related Articles

月額500円 vs 月額数万円。AIの「動かし方」で、コスト構造がひっくり返る

AIを使うのに、もうサーバーはいらないかもしれない。

ブラウザだけでLLMが動く「WebLLM」。1万円以下のRaspberry Pi 5にAI推論チップを載せる「AI HAT+」。そして、たった325行のPythonコードでニュース要約を自動化するプロジェクト。

この3つを並べて見えてくるのは、「AIを使うコストの桁が変わる」という事実だ。クラウドAPIに毎月数万円払っていた処理が、電気代500円で回る世界が、もう始まっている。

中小企業にとって、これは「面白い技術ニュース」ではない。経営判断の話だ。

WebLLM——ブラウザがAIサーバーになる

WebLLMは、ブラウザ内でLLM(大規模言語モデル)の推論を実行するオープンソースエンジンだ。WebGPUを使い、ユーザーの手元のGPUで直接モデルを動かす。

つまり、APIキーもサーバーも不要。ブラウザを開くだけで、チャットAIが動く。

何が変わるか?

  • API利用料がゼロになる。 OpenAIやClaudeのAPIに1リクエストごとに課金される構造から解放される
  • データが外に出ない。 顧客情報や社内文書をクラウドに送る必要がない。地方の中小企業が最も気にする「うちのデータ、大丈夫?」問題が消える
  • ネット回線が細くても動く。 モデルの初回ダウンロード(数GB)さえ済めば、あとはオフラインでも推論できる

もちろん制約はある。ブラウザで動かせるモデルサイズには限界がある。GPT-4クラスの性能は出ない。現時点で実用的に動くのはLlama 3 8BやPhi-3クラスで、パラメータ数でいえば数十億規模だ。

だが、考えてほしい。社内の問い合わせ対応、定型文の生成、議事録の要約——こういった業務に、GPT-4は必要か? 8Bモデルで十分な業務は、実は山ほどある。

「最高性能のモデルを使うこと」と「業務に必要十分なモデルを使うこと」は、まったく別の話だ。中小企業が勝つのは、後者の判断ができたときだ。

Raspberry Pi 5 + AI HAT+——1万円で「自社AIサーバー」が立つ

Raspberry Pi 5は、もともと約1万円前後の小型コンピュータだ。ここにHailo製のAIアクセラレータを搭載した拡張ボード「AI HAT+」(約1万円前後)を載せると、最大26TOPS(毎秒26兆回の演算)のAI推論性能を手に入れる。

初期投資の現実的な内訳はこうなる。

項目 価格(税込目安)
Raspberry Pi 5(8GB) 約12,000円
AI HAT+(Hailo-8L搭載) 約10,000円
microSD・電源・ケース等 約3,000円
合計 約25,000円

月額の運用コストは、ほぼ電気代だけだ。Raspberry Pi 5の消費電力は最大27W。AI HAT+を含めても30W前後。24時間稼働させても月間の電気代は約700円(1kWh=32円で計算)。

この構成で何ができるか。

  • 画像認識による検品自動化。 製造ラインのカメラ映像をリアルタイムで解析し、不良品を検出
  • 来客カウント・動線分析。 店舗のカメラ映像から人数や滞留時間を自動集計
  • 音声のリアルタイム文字起こし。 会議や電話対応の記録を自動化

重要なのは、これがすべてインターネット接続なしで動くという点だ。工場の製造ラインや、回線が不安定な地方の店舗でも、エッジで完結する。

クラウドの画像認識API(AWS RekognitionやGoogle Vision AI)を使えば、1,000枚あたり数百円〜数千円のコストが継続的にかかる。月に10万枚処理する工場なら、API代だけで月数万円だ。Raspberry Piなら、初期費用2.5万円と月700円の電気代。半年で元が取れる計算になる。

325行のPythonコード——「情報収集」の属人化が終わる

3つ目の事例は、325行のPythonコードで動くAIニュース要約ツールだ。

仕組みはシンプルだ。RSSフィードやニュースサイトから記事を自動収集し、ローカルLLM(またはAPIを最小限だけ使う構成)で要約を生成する。毎朝、自分の業界に関連するニュースが要約済みで届く。

325行。これがどれくらいの規模感かというと、Excelのマクロを少し書ける人なら読める量だ。特別なAIエンジニアは要らない。

中小企業の現場で、これが刺さる理由がある。

多くの会社で「業界ニュースのチェック」は特定の誰かに属人化している。社長が毎朝30分かけて日経を読む。営業部長がXで情報を拾う。その人が休んだら、情報が止まる。

325行のスクリプトは、この属人化を壊す。毎朝、決まった時間に、決まったソースから、決まったフォーマットで、要約が届く。 人に依存しない。再現可能。仕組み化の本質だ。

コストはどうか。ローカルLLMで完結させるなら、前述のRaspberry Pi構成で月700円。クラウドAPIを使う構成でも、1日50本のニュース要約なら月間1,500本。GPT-4o miniのAPI料金で計算すると、月額100〜300円程度で収まる。

社長の朝30分を時給換算してみてほしい。仮に年収1,000万円の社長なら、時給は約5,000円。30分で2,500円。月20営業日で5万円。月5万円の作業を、月300円で自動化できる。 これが「コストの桁が変わる」ということだ。

月額コスト比較——「クラウド従量課金」vs「ゼロインフラAI」

3つの技術を踏まえて、従業員30人規模の中小企業を想定し、月額コストを比較する。

パターンA:クラウドAPI依存型

項目 月額コスト
LLM API利用料(社内チャット・要約等) 約15,000〜30,000円
画像認識API(検品・分析等、月5万枚) 約5,000〜15,000円
クラウドストレージ・転送料 約2,000〜5,000円
合計 約22,000〜50,000円/月

※利用量に比例して増加。繁忙期にはさらに跳ねる。

パターンB:ゼロインフラAI型

項目 コスト
Raspberry Pi 5 + AI HAT+(初期) 約25,000円
WebLLM用PC(既存PCを流用) 0円
月間電気代 約700円
ニュース要約API(最小利用) 約300円
月額合計 約1,000円/月

※初期投資2.5万円は3ヶ月で回収可能。

月額5万円が月額1,000円になる。 50分の1だ。年間で約60万円の差。従業員30人の中小企業にとって、60万円は忘年会の予算ではなく、新しい人を1ヶ月雇える金額だ。

ただし、万能ではない。使い分けの判断基準

誤解のないように書いておく。ゼロインフラAIは万能ではない。

  • 高度な推論が必要な業務(契約書の法的レビュー、複雑なデータ分析)→ クラウドの大規模モデルが必要
  • 大量のデータを横断的に学習させたい場合 → ローカルでは計算資源が足りない
  • リアルタイム性と精度の両方が求められる場合 → エッジだけでは限界がある

判断基準はシンプルだ。「この業務に、GPT-4クラスの性能は本当に必要か?」と問うこと。答えがNoなら、ゼロインフラで十分だ。そして、中小企業の日常業務の8割は、Noだと思っている。

で、結局どうすればいいのか

3つのステップを提案する。

1. まず325行のニュース要約から始める。 投資ゼロ。既存のPCとPythonだけで動く。「AIで業務が変わる」という体験を、まず社内で1人が持つ。これが起点になる。

2. WebLLMを社内で試す。 ブラウザを開くだけ。社内FAQ対応や定型メール作成など、「毎日やってるけど頭を使わない作業」をAIに渡してみる。データが外に出ないから、情シスの承認も通りやすい。

3. 効果が見えたら、Raspberry Piでエッジを固める。 画像認識や音声処理など、常時稼働が必要な業務をエッジに載せる。2.5万円の投資で、クラウド課金から解放される。

いきなり全部やる必要はない。小さく始めて、コスト削減の実績を数字で出す。 その数字が、次の投資の根拠になる。

AIの民主化という言葉は使い古されたが、本当に起きていることは「AIの価格崩壊」だ。サーバー代が消え、API代が消え、残るのは電気代だけ。この構造変化に気づいた中小企業から、勝手に強くなっていく。 大企業の稟議が通るのを待っている間に、動いた者が勝つ時代だ。

POPULAR ARTICLES

Related Articles

POPULAR ARTICLES

JP JA US EN