技術・開発

Google、「Gemini 2.5 Computer Use」モデルを発表――AIエージェント競争に本格参入

Google(Alphabet Inc.)は2025年10月7日、Gemini 2.5 Computer Useモデルを発表しました。この先進的なAIシステムはWebサイト上で人間のように操作・ナビゲーションを行い、デジタルインターフェースに直接働きかけることが可能です。近年急成長しているAIエージェント市場において、Googleが新たな競争局面を切り拓く意欲を示すものです。

このComputer Useモデルは画像認識と推論能力を活用し、ボタンのクリック、テキスト入力、ページスクロール、フォーム送信など複雑なWebタスクを自動化します。従来型のAPI連携による自動化と異なり、画面上のグラフィカル・ユーザー・インターフェース(GUI)を認識して動作します。これにより、レイアウトやUIが動的に変化するWebサイトやアプリケーションにも柔軟に対応可能です。

Googleの競合戦略と性能優位性

この発表はOpenAIによるChatGPTエージェント拡張やAnthropicの類似技術の公開直後であり、競争の激化を象徴しています。Googleのモデルは、デスクトップ全体を制御するのではなく、あくまでブラウザ上の操作に特化しています。利用可能な主なアクションは13種類で、Webページの移動、テキスト入力、ドラッグ&ドロップなどをサポートします。

Gemini 2.5 Computer Useモデルは、複数のWeb・モバイルベンチマークで業界最高水準の性能を発揮。Web操作精度を計測するOnline-Mind2Webベンチマークでは76.7%(Claude Sonnet 61.9%、OpenAI 44.3%)、WebVoyagerテストでも79.9%(競合は69.5%、61.0%)という結果で、圧倒的な優位性を示しました。

この強みを活かし、既にGoogleのプロダクトで運用が始まっています。プロジェクトMarinerや検索のAI Mode機能などに組み込まれており、Googleの決済部門の内部テストでは「かつて手作業で数日かかっていたテストの60%以上を自動解決できた」と報告されています。

市場へのインパクトと開発者向け提供体制

Computer UseモデルはGoogle AI StudioやVertex AIで利用可能です。トークンベースの従量課金制で、入力200,000トークン未満の場合はミリオン単位で$1.25となります。無料プランがある従来のGeminiモデルとは異なり、AIによるコンピュータ操作モデルの利用開始時から有料アクセスが必須です。

AIエージェント市場は2023年に37億ドル規模、2025年には73億8000万ドルへの成長が見込まれており、今回の発表は市場シェア争いを一層加速させるとみられます。Googleは検索、Android、YouTube、Workspaceといった自社エコシステムとの深い統合を強みに、単体AI企業に対し優位なポジションを確立しています。2025年前半だけで、Google WorkspaceのAIによる文書処理は23億回以上に達しました。

AIによるPC操作はリスクも伴うため、Googleは多層的な安全対策を組み込んでいます。全操作に対する個別の安全性レビューや、開発者がAIの動作範囲を細かく制御できる設定を導入しました。購入などセンシティブな操作については必ずユーザーの確認を求め、不正アクセスやセキュリティリスクへの対策も万全です。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です