RAGは文書を足すほど精度が落ちる——中小企業の「小ささ」が、大企業のAIに勝つ構造的理由
Related Articles
結論から言う。データが多いほどAIが賢くなる時代は終わった。
RAG(検索拡張生成)に文書を突っ込めば突っ込むほど、回答精度は落ちる。
これは感覚の話ではない。論文で数字が出ている。ワイオミング州交通局のデータを使った実験で、RAGに投入する文書数を54から1,128に増やしたところ、回答精度は75%から40%以下に急落した。文書を20倍にしたら、精度は半分になった。
つまり「たくさんデータを持っている大企業ほど有利」という常識が、RAGの世界ではひっくり返っている。
これは中小企業にとって、構造的な追い風だ。
なぜ文書が増えると精度が落ちるのか
原因は「ベクトル検索の希薄化」と呼ばれる現象にある。
RAGの仕組みはシンプルだ。ユーザーの質問を受け取り、関連しそうな文書をベクトル検索で引っ張ってきて、その文書を参考にしてLLMが回答を生成する。要するに「カンペを見ながら答える」仕組みだ。
問題は、カンペが増えすぎると何が起きるか。
文書が少ないうちは、検索で引っ張ってくる文書の大半が「当たり」になる。しかし文書が増えると、似ているけど微妙に違う文書、関連はあるが本質ではない文書が大量にヒットし始める。LLMはそのノイズ混じりのカンペを見て回答するから、当然、精度が落ちる。
54文書なら「この質問にはこの文書」とほぼ一対一で当たる。1,128文書になると「この質問に関係ありそうな文書が30件」となり、LLMはどれを信じていいかわからなくなる。
大企業が陥りやすい罠はここだ。社内の全部門のマニュアル、議事録、規程、FAQ、過去の報告書——何でもかんでもRAGに食わせれば賢くなると思っている。実際は逆だ。食わせるほどノイズが増え、回答は曖昧になり、現場は「使えない」と判断して離れていく。
中小企業の「小ささ」が武器になる構造
ここからが本題だ。
中小企業のデータは、そもそも少ない。そして、業務範囲が狭い。これが圧倒的な強みになる。
例えば、従業員30人の製造業を考えてみてほしい。扱う製品は数十種類、取引先は数十社、業務マニュアルはせいぜい数十ページ。このデータをRAGに入れたらどうなるか。
文書数は数十〜数百。検索の希薄化はほぼ起きない。質問に対して「当たり」の文書がピンポイントで返ってくる。結果、精度は高い水準を維持できる。
しかも、データの質が均一だ。大企業のように部門ごとに用語がバラバラ、フォーマットが統一されていない、という問題が起きにくい。10人の会社なら、全員が同じ言葉で同じことを指している。この「用語の一貫性」が、ベクトル検索の精度を底上げする。
具体的な数字で言おう。
大企業がRAGシステムを構築する場合、データの整備・クレンジングだけで数百万〜数千万円かかることがある。部門横断のデータ統合、用語の標準化、権限管理——これらすべてが必要になるからだ。
一方、中小企業なら、業務に直結するマニュアルと過去の問い合わせ履歴を整理してRAGに入れるだけで動く。クラウドのベクトルDBとAPIを使えば、月額数千円〜数万円で運用できる。初期構築も、やり方次第では数十万円で済む。
300万円かけて精度40%の大企業RAG vs 30万円で精度75%の中小企業RAG。
この構図が、いま現実に起きている。
「ドメイン特化」は戦略ではなく、中小企業の自然体
大企業がRAGの精度を上げようとすると、「ドメイン特化」のアプローチを取る必要がある。つまり、全社横断ではなく、部門ごと・業務ごとにRAGを分割して構築する。これは正しいアプローチだが、組織が大きいほど実行コストが跳ね上がる。
中小企業は違う。そもそも業務ドメインが絞られているから、意識しなくても「ドメイン特化RAG」になる。戦略として選んでいるのではなく、自然体でそうなる。
この差は大きい。
大企業が「RAGの精度が出ない」と言ってコンサルに数百万払い、データ設計をやり直し、半年かけて再構築している間に、中小企業は「とりあえず今ある文書を入れてみた」で動くRAGを手に入れられる。
もう一つの落とし穴——AIの「偽の自信」
精度の問題はRAGだけではない。LLMエージェント全般に「偽成功」という厄介な特性がある。
これは、AIが「タスクを完了した」と自信満々に報告するが、実際には失敗しているという現象だ。研究によれば、特定のベンチマーク環境下で、AIが「成功した」と判断したケースのうち、相当数が実際には不正確な結果だった。
この問題は、データが大規模で複雑なほど顕著になる。大企業の複雑な業務フローの中でAIエージェントを走らせると、AIは「それっぽい回答」を自信たっぷりに返すが、現場の人間が見れば明らかに間違っている——という事態が頻発する。
中小企業の場合、業務の複雑さが限定的だから、AIの回答が正しいかどうかを現場の人間がすぐに判断できる。社長自身が「これは違う」と気づける規模感。このフィードバックの速さが、RAGの精度改善サイクルを加速させる。
大企業では、AIの回答が間違っていても、それに気づくまでに何層もの承認プロセスを経る。中小企業なら、使った人がその場で「違う」と言って、その日のうちにデータを修正できる。
で、結局どうすればいいのか
中小企業がRAGで成果を出すためのポイントは3つだ。
1. 入れる文書は絞る。「全部入れ」は最悪手。
業務に直結する文書だけを厳選して入れる。「いつか使うかも」という文書は入れない。文書数が少ないことは弱みではなく、精度を保つための最大の武器だ。
2. まず1業務で試す。全社展開は後。
「見積もり作成」「顧客からの問い合わせ対応」「製品仕様の確認」——どれか一つに絞って、小さく始める。そこで精度が出ることを確認してから、次の業務に広げる。
3. 現場の「違う」を即反映する仕組みをつくる。
RAGが間違った回答を返したとき、現場の人間がワンクリックでフィードバックできる仕組みを入れる。このサイクルが回れば、RAGの精度は使うほど上がる。大企業には真似できないスピードだ。
小さいことは、もう弱みじゃない
AIの世界では長らく「データを持っている者が勝つ」と言われてきた。それは学習データの話であって、RAGの運用においては真逆の構造が生まれている。
データが少ないから精度が出る。業務が狭いからノイズが入らない。組織が小さいから改善が速い。
中小企業の「小ささ」は、AI活用においてはじめて、構造的な優位性に変わった。
これは一時的なトレンドではない。RAGの仕組み上、ベクトル検索の希薄化問題は文書が増えるほど必ず発生する。技術が進化しても、この構造は簡単には変わらない。
大企業の真似をする必要はない。むしろ、大企業にはできない「小さく、速く、尖ったRAG」を武器にすべきだ。
文書54件で精度75%。この数字を、自分の会社の武器に変えられるかどうか。答えは、まずやってみた先にしかない。
—
JA
EN