【今週の話題】Gemini CLIがリリース
かねてから噂されていたGoogleのGemini公式のCLI型コーディングエージェント「Gemini CLI」がリリースされました。Gemini CLIはClaude Codeのようにターミナル(CLI)から使えるツールです。モデルは標準でGemini 2.5 Proが無料で使え、WindowsでもWSLなしに動作します。
Gemini Agentシリーズ
GoogleはGeminiを基盤としたコーディングエージェントのポートフォリオを強化してきており、すでにDevinライクな完全自律型エージェントのJulesのプレビューが始まっています。

筆者の先月のポストで分類した「エディタ型」にあたる製品は、実はすでに「Gemini Code Assist」という名前で存在していましたが、チャット応答までの機能しか備えておらず、エージェントとしての自立実行モードは未実装でした。しかし、今回のGemini CLIのリリースに連動してこの機能も連日アップデートが行われています。
Gemini Code Assistバージョン2.38.0にはこのGemini CLIが統合されており、VS Codeからでも導入できます(拡張にNPMパッケージがバンドルされていました)。この拡張をインストールするとGitHub CopilotのAgentモードのようにGeminiのチャットが使えます。
また、最新版のAndroid StudioにはGeminiが統合されており、プレビュー版ではAgent modeが試せます。

さらに、IntelliJ版Gemini Code Assistプラグインでの近々対応が予想されます。

Gemini CLIの評判
Gemini CLIの目下の比較対象はAnthropicのClaudeCodeですが、Gemini CLIの方が優秀と評価するユーザーはまだ少ないです。
筆者は最近、コーディングエージェントの基本性能を定量的に評価できるベンチマークハーネスを作っています。そこではAider Polyglotベンチマークを参考に101個のTypeScriptコーディングクイズをエージェントに一度の指示のみでユニットテストがパスするかどうかを測ります。
Gemini CLIでもこのベンチマークを実施したかったのですが、現在のGemini CLIが用意しているキャパシティでは評価のベンチマーク実行のアクセス数に耐えられる要件がありませんでした。そのため、テスト中に429エラーが発生してしまいました。
ただし、対話的にコーディング実行することは可能だったため、上記ベンチマークハーネスの中で難問とされる「ボーリングスコア計算機」の実装をGemini CLIに依頼しました。この問題はExercismの以下の演習で公開されているもので、ボウリングのスコア計算に関連する複数の条件分岐が登場する演習です。

これはLLMがよくミスをする問題で、あの秀才Claude-4Sonnetでも数百秒のフィードバックループ内で解けず途中で諦めます(最終的には解けます)。新入りのGemini CLIにこの問題を挑戦してもらったところ、10分間コードを書き換え続けてもテストがパスしなかったため、今回は失敗と判断しました(そのまま放置しておいたら1時間以上コーディングしていました)。

/editorコマンド
小ネタとして、/editorコマンドはGemini CLIの変更提案を任意のエディタ上で閲覧するための設定です。リモートやサンドボックス環境ではVimのみ動作します。

google_web_searchツール
Gemini CLIの特徴として、google_web_searchツールを備えている点が挙げられます。Claude Codeも独自のWebSearchツールを提供していますが、google_web_searchツールによる検索結果の方が評判は良いです。
これはGeminiAPIのGoogle Searchツールと同じものであり、Google SearchツールはGeminiAPIのテキスト生成にWeb検索結果の引用をグラウンディング(根拠付け)する拡張機能です。Google Searchツールの詳細は以下のドキュメントに記載されています。

Gemini CLIの実装としては、google_web_searchツールで検索し、web_fetchツールでコンテンツを取り出します。ページを丸ごとダウンロードしてくるわけではなく、GeminiへURLを送ると要約したコンテンツが返ってきます。フォールバック時にはhtml-to-textのルールベース処理がコンテキストの外で実行されて、抽出結果だけが戻されます。
すでにユーザーたちによってこのgoogle_web_searchツールを駆使する方法が検証されています。たとえば、mizchiさんは以下の記事でclaude codeからgeminiコマンドを呼び出すスラッシュコマンドの例を示しています。

また、cnosukeさんやミロさんはこのGoogle Searchツール呼び出し部分を取り出し、単独のMCサーバーを構築しています。
OSSなのでDeepWikiもすでにインデックスされています。軽くアーキテクチャを確認したところFunction Calling(tools)を使った素直なループ実装でした。すべてをUnixコマンド化するOpenAI Codex CLI のような奇妙なことはしていませんが。折りたたみToDoデータベースをローカルに構築して並列化するClaude Code のような驚きある試みもありません。