Anthropicがマウスを動かし始めた——「AIが画面を操作する」時代、属人化業務が月3万円で消える逆転構造
Related Articles

AIがマウスを握った。これが何を意味するか、わかるだろうか。
Anthropicが「画面操作API」を公開した。AIがマウスを動かし、キーボードを叩き、画面上のボタンをクリックする。プログラムのAPIが用意されていなくても、人間と同じように画面を見て操作する。
これ、地方の中小企業にとっては事件だ。
なぜか。「うちの基幹システム、古すぎてAPI連携できないんですよ」——この言葉を何百回聞いてきたか。RPAを入れようとしても年間数百万。結局、ベテラン事務員が手作業で回している。その人が辞めたら終わり。これが日本中の中小企業のリアルだ。
そのリアルが、根こそぎ変わる可能性がある。
「Excelマクロ職人」の仕事が月3万円になる構造
具体的な話をしよう。
ある製造業の中小企業(従業員30名)で、こんな業務がある。受注データをメールで受け取り、基幹システムに手入力し、Excelの管理表に転記し、納期を計算して返信メールを作成する。これを1日平均2時間、月に約40〜60時間、ベテラン事務員1人が担っている。
時給1,500円で計算すると月6〜9万円。だが本当のコストはそこじゃない。その人が休んだら業務が止まる。辞めたら引き継ぎに3ヶ月かかる。採用コストは50〜100万円。属人化の本当の怖さは「見えないリスクコスト」だ。
Anthropicの画面操作APIを使えば、この一連の作業をAIが画面操作で代行できる。基幹システムにAPIがなくても関係ない。人間と同じように画面を見て、入力欄をクリックして、データを打ち込む。
API利用料はどうか。現時点でClaude 3.5 Sonnetのコストで試算すると、1回の画面操作タスクあたり数十円〜数百円程度。月に500回の定型操作を回しても、API費用は月2〜3万円に収まる計算だ。仮にインフラ費用やプロンプト調整の保守を含めても月3〜5万円。
月9万円の人件費が月3万円になる。年間で72万円の削減。だが繰り返す、本当の価値は金額じゃない。「その人が辞めても業務が止まらない」——この安心感に値段をつけられるか。
なぜ「画面操作AI」は中小企業にとって逆転の武器なのか
ここで構造的な話をしたい。
これまで業務自動化の選択肢は、大きく3つだった。
| 手段 | 初期コスト | 月額コスト | 導入期間 | 中小企業の現実 |
|---|---|---|---|---|
| 基幹システム刷新 | 500〜3,000万円 | 10〜50万円 | 6ヶ月〜2年 | 論外 |
| RPA(UiPath等) | 100〜300万円 | 5〜20万円 | 1〜3ヶ月 | 高すぎる。保守も重い |
| Excelマクロ/VBA | 0〜50万円 | 0円 | 数週間 | 作った人が辞めたら終わり |
| 画面操作AI | 5〜20万円 | 3〜5万円 | 数日〜2週間 | ここが本命 |
ポイントは「APIがないシステムでも自動化できる」という点だ。
大企業はSalesforceやSAPを使い、APIで連携し、専任のIT部門が保守する。中小企業にはそんな余裕はない。20年前の販売管理ソフトが現役で動いていて、誰もソースコードを触れない。それでいい。画面操作AIは、その「触れないシステム」をそのまま自動化する。
これは中小企業だからこそ効く武器だ。大企業はすでにAPI連携で自動化している。中小企業は「API連携できない」からこそ、画面操作AIの恩恵が圧倒的に大きい。コスト削減のインパクトが、大企業の比じゃない。
マルチエージェント——「1人AI」から「AIチーム」へ
もう一歩先の話をする。
画面操作AIが1つのタスクを自動化するなら、複数のAIエージェントが連携すれば「業務フロー全体」を自動化できる。最近の研究(EntCollabBenchなど)では、役割を専門化したマルチエージェントシステムが、単一エージェントより明確に高い精度を出すことが示されている。
具体的にイメージしてほしい。
- 受注エージェント:メールから受注情報を抽出し、基幹システムに入力
- 在庫確認エージェント:在庫管理画面を開いて在庫数をチェック
- 納期計算エージェント:生産スケジュールと在庫から納期を算出
- 返信エージェント:顧客に納期回答メールを自動送信
- 承認エージェント:異常値(大量受注など)があれば人間に確認を回す
今まで1人のベテラン事務員の頭の中にあった「判断の流れ」が、エージェントの連携として外部化される。属人化が構造的に消える。
しかもこれ、各エージェントの「やること」はプロンプト(自然言語の指示書)で定義される。プログラミングではなく、日本語で書ける。つまり、現場の業務を一番知っている人が、自分で設計できる。
SIerに数百万払って要件定義する時代が、終わりに向かっている。
冷静に見るべきリスクと限界
ただし、今すぐ全部置き換わるという話ではない。正直に書く。
精度の問題。 現時点の画面操作APIは、複雑な画面遷移や動的に変わるUI要素に対してミスをすることがある。Anthropicの公式ドキュメントでも「まだ実験段階(beta)」と明記されている。本番業務に入れるなら、必ず人間のチェックポイントを挟む設計が必要だ。
セキュリティの問題。 AIが画面を操作するということは、AIにログイン情報やシステムへのアクセス権を渡すということだ。中小企業ほどセキュリティポリシーが曖昧な場合が多い。ここは導入前に整理すべきだ。
「何を自動化するか」の選定。 全部自動化しようとすると失敗する。まずは「毎日やっていて、手順が決まっていて、ミスすると面倒な作業」から始める。月10時間以上かかっている定型業務が1つあれば、そこから実験すればいい。
で、結局どうすればいいのか
3つだけ言う。
1. 今すぐ「属人化業務リスト」を作れ。
社内で「あの人しかできない」業務を全部洗い出す。それが画面操作AIの導入候補だ。
2. 小さく実験しろ。
Anthropicの画面操作APIはAPIとして公開されている。まずは1つの定型業務で試す。初期投資は5〜20万円。失敗しても致命傷にならない金額だ。
3. 「仕組み化」を目的にしろ。
コスト削減は結果であって目的じゃない。目的は「誰がやっても同じ結果が出る状態」を作ること。それが中小企業の生存戦略だ。
これは「自動化」ではなく「構造変化」だ
最後に、一番大事なことを書く。
Anthropicの画面操作APIが示したのは、「APIがないシステムでも自動化できる」という技術的な話だけじゃない。「自動化のコストが劇的に下がったとき、企業の競争力の源泉が変わる」という構造の話だ。
これまで中小企業の強みは「ベテランの経験と勘」だった。それは裏を返せば「その人がいなくなったら終わり」というリスクだった。
画面操作AIとマルチエージェントの組み合わせは、「経験と勘」を「再現可能な仕組み」に変換する。月3〜5万円で。
大企業が数千万かけてやってきたことを、中小企業が数万円でできる時代が来ている。これを使わない理由があるなら、教えてほしい。
まず1つ、試してみればいい。答えは画面の向こう側にある。
—
JA
EN